forestsunspotさんのページ


投稿したアイディア (1件)

by forestsunspotさん 深層学習型AI(標準日本人UI)訓練用データ収集Web作成

   
賛1 | 中2 | 反0
2件目 /

背景 深層学習により、音声認識、音声合成の精度、画像認識、画像合成の精度が飛躍的に向上している。 こうしたAIによるマンマシンインタフェースは、行政のみならずあらゆる産業で利用されるように なると思われる。しかし訓練には膨大なデータが必要であり、これを提供出来るのは一... >>詳しく

- 1ポイント 3票 13コメント - 2017/03/13 14:47 問題を報告

お気に入りアイディア (0件)

現在、まだお気に入りがありません。

投稿したコメント (7件)

深層学習型AI(標準日本人UI)訓練用データ収集Web作成

私が言いたかったのはこういうことです。
https://japan.cnet.com/article/35098179/
民間がアプリ作るにしても、常識APIをコール出来れば、随分生産性が上がるでしょう

by forestsunspotさん - 2017/03/21 09:06 問題を報告

#011現段階では言葉→画像生成(GAN),画像→言葉による説明は出来るようになってます。
例えば乗馬の絵をかけという命令をした際、AIは、乗馬というのが、「人」、
「馬」の意味(=画像)、乗るという事の意味(人が馬にまたがる)を知ってる必要があります。意味が「分かる」というのは、読んで字のごとく既知の(イメージが描ける)要素まで分解していくことだと思います。
幼児教育というのは、たとえ話で、まずは身の回りの当たり前の事物の学習(イメージとタグ付け)から始めるという意味です。ディプラーニングは機械学習の1分野なので、教師ありも、教師なし訓練もあります。確かにレコメンデーションは教師なしですが。今言ってるのはあくまで、教師ありです。

by forestsunspotさん - 2017/03/16 15:13 問題を報告

#009必要なのはタグ付けデータです。
手書き文字認識システムもありますが、おそらく古いやりかた(特徴量のプログラミング)
で作っているはずなので、汚い手書きだと読み取れないでしょう。ここで一段と精度を上げるには
深層学習使うしかないのではと思います。
特定分野(記入文字種が限定される)では既に下記のような取り組みが始まってるので、役所の申請書類の場合、
書式は分かっているので、通常のプログラミングで入力欄の位置を特定し、あとはAIが手書き文字を読み取るだけでいいと思います。
http://www.sankei.com/photo/daily/news/161109/dly1611090024-n1.html
幼児教育の例は、上記の短期的、現実的なAIの話ではなく、長期的な話で、いわばAIに常識を教えて、
ある程度汎用的な利用に耐えるものを、作る必要がでてくるのではと思ったからです。
単に基本的な概念に関し、対応する文言、読み、画像を大量収集していくという意味です。
高度な推論型AIに移った時、土台となる概念を理解してないと意味不明と思うので。

by forestsunspotさん - 2017/03/16 12:24 問題を報告

#007そうですね。オープンデータというのは、一般に官→民のアウトバウンドの
仕組みですが、深層学習時代にあっては(民)→官→民というインバウンドのデータ収集プラットフォームの仕組みも必要だと思います。ある程度共通部分のAIは国が提供し、重複の無駄を排す。
国が危機感を抱いてるのも「言葉=文化」なので、日本人と同じように日本語を解する
AIの育成が必須となります。同様の構図で「訛り=地方文化」なので、その地方の言葉を解する
AIの育成が必要となります。これが出来れば、地方AI←→標準日本語AI←→外国語AIという
連携により、その土地の人が、普段のしゃべりかたそのままで訪日外国人と会話できるようになります。標準語を強制されずに済む。その土地の文化が守られるという事です。
この事実に早く地方の人が気づいてくれればと願うばかりです。その土地のAIを育てるには、
その土地の人が育てるしかありません。今回の投稿はその実現のための案です。最後になりましたが、当方の投稿にコメント頂きありがとうございました

by forestsunspotさん - 2017/03/16 08:06 問題を報告

#005例に挙げたのは初歩的な例で、民間で出来る量のデータ量なので、ご紹介の
通り、現実に民間事業者が出てきています。しかし人間以上の音声認識能力、画像認識能力
を得ている外国のAIは、膨大なデータで訓練されており、マイクロソフトやグーグルのような
巨大企業でしかなし得ません。これは、私の意見ではなく、既に紹介したスタンフォード大のアンドリュー・ング准教授が、ある講演会で、終わった後の質疑応答で、スタートアップから「今から参入できるか?」という質問に答えて、NOと答え、あるものを(API)利用したほうがいいと助言した時の言葉です。事実アメリカでは、音声認識のアマゾンエコーAPIを組み込んだ製品が多く出てきています。日本も危機感を感じて、こういうプロジェクトを、立ち上げるようですが、膨大なデータ収集はどうしようとしてるのか不思議です。深層学習が実現できるようになったから、ブレークスルー出来たのであり、他の方法で人間の音声認識能力を超えられるとは思えません。http://www.itmedia.co.jp/news/articles/1701/10/news055.html

by forestsunspotさん - 2017/03/16 06:55 問題を報告

#003 うーん。具体的な改善例で言うと、役所の窓口で市民が必要書類に記入したデータを、
職員がキーボードで入力してますよね?あれがカメラにかざすだけで入力できるようになります。
職員の負荷が減ります。窓口業務の自販機かが進むと思います。10年先を想定して、地道な
準備を始めたほうがいいと思います。訛りは業務が画一化されている行政事務では、そう問題
にはならないかもしれませんが、完全無人化を目指した時、音声認識の精度をあげるには
訛り(イントネーション)をAIが認識出来ることが必要です。目的(行政の効率化)に向けた
1手段を書いたつもりです。

by forestsunspotさん - 2017/03/15 06:42 問題を報告

#001深層学習に関しては、この分野の専門家のスタンフォード大のアンドリュー准教授曰く、
AIの賢さは訓練用データの質・量と訓練用マシンパワーで決まるそうです。
だからこそ、各社は、アルゴリズムは公開すれど、訓練用データは決して公開しません。
例え新しいアルゴリズムが出たとしても、データは必要なはずで、再訓練すればいいだけのはず。
マシンは最近理研に導入された深層学習用のを使えばいいでしょう。
国のブランドで推進してこそ、日本国民の底力が発揮され多量の良質な訓練用データが集まると思います。
そういう国民性の強みを生かさない手はないと思います。
国の支出で外国勢に対抗できる量のデータが集められるとは思えません。
また、常用漢字を国が指定しているように、どの範囲の常識を教え込んだAIを育成するかは、まさしく国の役割だと思います。
最終目標は地方文化を理解出来るAIの育成です。「標準日本人AI」の育成はその中間ステップです。
「標準○○県人AI」は、一から育成する必要はなく、「標準日本人AI」にヒモつけさえすればいい事になります。

by forestsunspotさん - 2017/03/14 08:40 問題を報告

投票履歴 (1件)

賛成 深層学習型AI(標準日本人UI)訓練用データ収集Web作成 2017/03/13 14:47

高評価コメント(0件)

他のユーザからの評価(★の数)の平均が4以上のコメントを表示しています。

 

OpenIDの紐付けしておけば、そのサービス提供会社のアカウント情報でもログインできるようになります。以下のリンクをクリックすると、各社のサイトにジャンプしますので、その画面の指示に従って下さい。