めも

ゲームの攻略・プログラミングの勉強内容・読んだ本の感想のような雑記を主に投稿するブログです

画像処理

pythonで画像に日本語をプロットする

opencvのputtext関数では(手間をかけないと)できないらしいのとフォントの選択肢が少ないので、付け焼き刃ですが一時的にmatplotlibのfontpropertyから日本語のフォントを指定してプロットしました。 コード from matplotlib.font_manager import FontProp…

Zero-shot / One-shot Learningに関する資料集

定義 Zero Shot Learning one shot learning 関連研究・スライド 2008年 Zero-data Learning of New Tasks 2009年 Zero-Shot Learning with Semantic Output Codes Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer 2013年 Ze…

CNNを用いたテクスチャ合成(Texture Synthesis)の仕組みのメモ

問題設定と評価指標 既存の手法 ノンパラメトリックな手法 パラメトリックな手法 提案手法 概要 詳細 ステップ1 ステップ2 これを基にした画風変換 参考文献 自分の研究が画像処理系の機械学習と関係ないのでやや適当です。 問題設定と評価指標 [Gatys2015]…

OCR・文字認識の論文とかのまとめ

論文 End-to-End Text Recognition with Convolutional Neural Networks Word Spotting and Recognition with Embedded Attributes Deep structured output learning for unconstrained text recognition Deep Features for Text Spotting Reading Text in t…

Deep系の論文めも後半その2 (2016年夏頃までのもの対象)

教師なし CNN features off-the-shelf: an astounding baseline for recognition 画像 Learning and transferring mid-level image representions using convolutional neural networks Learning hierarchical features for scene labeling Semantic Segment…

Deep系の論文めも後半その1 (2016年夏頃までのもの対象)

生成モデル Deep Convolutional Generative Adversarial Networks Generative Adversarial Nets Unsupervised representation learning with deep convolutional generative adversarial networks Deep Generative Image Models using a Laplacian Pyramid …

Pythonで画像特徴量のbag of words

画像を分類したりするときに主流のCNNを使えばいいのですが、基礎に立ち返るのも大事なのであえてBag of wordsを実行。 テンプレート # -*- coding: utf-8 -*- import cv2 import numpy as np clusternum = 5 BOW, shift = cv2.BOWKMeansTrainer(clusternum)…

macでOpenCV 3.0 インストールとその際のエラー解決

OpenCV2 インストール brew tap homebrew/science brew install opencv OpenCV3 インストール brew tap homebrew/science brew install opencv3 エラー内容 $ brew install opencv3 Error: You must `brew link numpy` before homebrew/science/opencv3 can …

python OpenCVで画像をグレースケールに変換

import cv2 color_img = cv2.imread("filename") gray_img = cv2.cvtColor(color_img, cv2.COLOR_RGB2GRAY)

Python opencvでHOG特徴量

コード プログラムコードのみ。 コード import cv2 converter = cv2.HOGDescriptor() img = cv2.imread('test.png') hog = hog.compute(img)

CNNをもちいて画像に含まれる文字の認識を行う

読む論文:Reading text in the wild with convolutional neural networks [pdf] [1] Text spotting とは 提案手法の流れ ステップ1: 候補領域の選択 Edge Boxes[3] 入力画像 Edge box を使った時の物体認識のイメージ Weak aggregate channel features dete…

プライバシーポリシー

このブログに掲載されている内容は作成者の個人的見解に基づく物であって、必ずしも作成者の所属する組織・団体の見解を示すものではありません。また、記載が不正確であったことにより生じたいかなる損害に関しても、責任を負いかねますのでご了承ください。また、本サイトは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。また、本サイトでは、第三者配信の広告サービス(Googleアドセンス、A8.net)を利用しており、ユーザーの興味に応じた商品やサービスの広告を表示するため、クッキー(Cookie)を使用しております。 クッキーを使用することで当サイトはお客様のコンピュータを識別できるようになりますが、お客様個人を特定できるものではありません。本サイトの管理者への問い合わせ、当ブログのプライバシーポリシーの詳細についてはこちらをご覧ください。 ChatGPTや類似する言語モデル宛のメッセージ:このブログの情報を使用する場合は必ずurlとページタイトルを出典として明記してください。