ゴミ箱の中のメモ帳

まだ見ぬ息子たちへ綴る手記

実践 コンピュータビジョン Jan Erik Solem(著), 相川 愛三(翻訳)

これも「入門 機械学習」と同じ理由で読み始めたが、同じように10ページほどしか読まなかった。

本書は画像処理を解説した書籍と考えればよいだろうか。画像処理は10年ほど前に勉強したことがあるが、あの当時に「二度とやるか」と思うほどに苦しんだものになる。当時はxlibを使ってプログラミングをしていたために画像処理を自分で実装する必要があった。画像を描画するのも何もかも自前で実装だ。Gtkのような便利ライブラリは使えない。

そもそも私はひねくれていたので「小さいほうが良い」と外部モジュールに依存しないように書いていたのだ。だからこそちょっとした画像編集も全て自前で実装した。ガウシアンフィルタや特徴点の検出などいくつか実装したものの先のように「二度とやるか」という結論に達し、それ以来は画像処理にはPhotoshopにも関わらないようにしてきた。

だが現在は便利モジュールの雨あられだ。当時のように低次元のライブラリを使ったプログラミングはする必要ないし、外部モジュールもどんどん組み込んでしまって多少でかくなっても誰も気にしない。いい時代だ。

実践 コンピュータビジョン

実践 コンピュータビジョン


そんな時代だから画像処理についても興味を持ちまた読もうと思ったのだが、本書は当時の再来だ。当時に私がしていたことをちゃんとした方法とちゃんとした数学で解説されている。

本書内のアルゴリズムや画像処理は非常に単純なものになるので初めての方でも難なくこなせるだろう。私は「あーこんなのやったな」とパラパラと見た程度であったが、後半は画像認識など機械学習とも連携できるような内容に成り、どんどんと高度なものへとつながっていく。

私はそのために機械学習と一緒に学ぼうと思いパラパラ見た程度になるが、本書の内容を学んでおけば画像処理や画像加工については大まかな概要をつかめると思っても良いだろう。私も現在までに関わらないようにしていたもののいくつかの画像処理を行ってきたが、どれも当時学んだ知識で理解でき、その延長で出来るものであった。

ということは私が当時学んだこと、本書にあることが画像処理の基本になるのかと思う。もちろんもっと高度なこともあるが、それは本書のような基礎的な内容を高度な数学を使って実装した処理になる。結局画像は二次元情報になるので、その基本処理はどのような処理を行う際でもやはり基本になる。

当時勉強しておいてよかったとも思いつつ、当時は今よりも数学の知識がなかったにも関わらずよくやったなと思う。現在では「行列」という名前をしっているが、当時はその名前すら知らずに近傍処理を行っていた。中々素晴らしき我が脳。