日々、せれんでぃぴてぃ

書きたいことをただ書きなぐる超雑記ブログ。

MENU

ディープラーニングを活用した面白い試みについてまとめてみた。

スポンサーリンク

 

  f:id:yshknt0736:20160914230638j:plain

 

少し?前にテレビでも話題になった『ディープラーニング』

本記事では、そのディープラーニングを活用した面白い例を紹介したいと思います。

 

 

 

記事を書こうと思ったきっかけ「きゅうり自動仕分け機」

 

まず、この記事を書こうと思ったきっかけを紹介します。

きっかけはネットで以下の記事を読んだことです。

 


 

この記事ではGoogleのオープンソース「Tensor Flow」を使ってきゅうりの自動仕分け機を開発した個人農家について書かれています。

 

記事を要約すると

  • きゅうりの仕分けは明確な業界基準がなく農家ごとの目利きで選定している。
  • 目利きは長さ、太さ、色艶などを総合的に判断する。そのため、正確な目利きの技術は一朝一夕で身につくものではなく、長年の経験がものをいう。
  • きゅうりの画像を7000枚以上撮影し、ディープラーニングを使って機械に学習させた。
  • サンプルデータを使っての正解率は95%だが、新しい画像で試すと70%にダウンするため、より多くのテストデータが必要

となります。

 

開発したのが、以前自動車部品メーカーの制御システム開発担当をしていた農家の息子ということで、何の知識もない人が作れるレベルではないというのが実情。

しかし、個人で人工知能(しかもオープンソース)を活用して、ここまでできることに驚き、この他にどのような試みがされているのか調べようと思いました。

 

 

ディープラーニングを活用した試み

AlphaGo

 

ディープラーニングを用いたものの中でも特に有名なのが「AlphaGo」


オセロやチェスといったボードゲームでは、従来の人工知能でも人間に勝利していました。しかし、囲碁については次に取り得る選択肢が多すぎるため、計算を処理できず難攻不落の砦といわれていました。

そんな囲碁もディープラーニングによってついに攻略されてしまいました。

しかも、ただのプロ棋士に勝ったのではなく、現代囲碁界最強と名高いイ・セドル九段に勝ってしまったのです笑

 

 

株価の自動予測

 

誰もがあったらほしいと答えるであろう株価の自動予測システム。

このシステムをディープラーニングで作ろうとした人がいました!

 


現状、テストデータで67%の正解率だそうです。

 

プログラムを行われた方によると、データの準備とパラメータの調整が大変とのこと。

先ほどのきゅうり自動仕分け機にしても7000枚の写真を使って、なお「過学習」が発生しています。(過学習とは少数の学習用データに偏って学習してしまう現象のこと)

過学習が発生しないようにするには、大量のデータが必要となるため、そういった面でも個人での利用がまだまだ難しいと感じます。

 

上の記事ははてなブログですが、Qiitaにも同じような試みをされていた方がいました。

 

 

 

アイドルの顔識別

 

世間では「アイドルの顔はみんな同じに見える」というよく言われています。

その言葉から着想を得て、ディープラーニングによる顔識別システムを作ったという試み。

 

 

この記事のシステムでは、ももくろの5人のメンバーについて識別を行えます。

こちらは学習用データの写真が1000枚で正解率が75%

データ不足が原因なのかは分かりませんが、80%の壁を超えるのが難しいみたい。

 

 

似たような試みでラブライブ!のメンバーを識別するものもありました。

 

 

医療分野での活用

 

ディープラーニングは医療分野でも活用が期待されています。

その一例がレントゲン写真やCTスキャン画像から病気を判定するという試み。


 

画像からではなく、医療データから治療方針や薬について情報を提案してくれるシステムも開発されています。


 

人間の声に近い人工音声の生成

 

Googleの人工知能研究企業であるDeepMindではディープラーニングにより、人間の声を解析し、それに近い人工音声の生成する技術「WaveNet」を実現しました。


従来の人工音声(TTS)では、前後の単語による音声の変化を要素として組み込むことができず違和感が残るという課題がありました。

しかし、ディープラーニングを用いることで、音声クリップとテキストを対応させることができるようになったそうです。

 

DeepMind社のページでTTSとWaveNetの聞き比べができるのですが、確かにWaveNetの方が、単語と単語のつなぎの発音が人間に近く感じます。

 

 

まとめ

 

以上まとめてきましたが、精度を高めようとするとどうしても膨大なテストデータが必要となり、個人ではなかなか難しいという印象でした。

 しかし、「Tensor Flow」をはじめとするオープンソースが多々あり、専門書も出ているため、簡単なものならば趣味で作れるくらいには身近なものになってきたのかなと思います。

 

企業が行っている試みについては、お金がかかっているだけあってどれも便利で素晴らしいものだと感じました。

これだけ多くの試みがされているとなると、近い将来、日常生活で使用する多くのものにディープラーニングが関わるようになるのかもしれません。

 

今回はこれくらいですが、気になる試みを発見した都度、更新していきたいと思います。