microsoftgarage-screenshot-2

1: ノチラ ★ 2017/09/01(金) 17:55:20.97 ID:CAP_USER.net
Microsoftの研究員が開発した音声認識システムが、人間の速記者と同レベルとされる単語誤り率を達成した。

 Microsoftは米国時間8月21日、同社の音声認識システムが、プロの速記者に匹敵するとされる5.1%の単語誤り率に達したと発表した。

Microsoftは2016年、5.9%の単語誤り率で「ヒューマンパリティ(人間と同程度)」に到達したと考えたが、IBMの研究員らは、そこまでのレベルに達したとするには、IBMの最高記録である5.5%をやや上回る5.1%に達する必要があると主張した。

 IBMが実施した速記者に関する研究では、数人に会話を何回か聞いてもらい、もっとも優秀な速記者の結果が選ばれた。

 Microsoftのシステムは、2016年のテストと同様に、データセット「Switchboard」コーパスを使って測定された。Switchboardコーパスは、見知らぬ者同士が電話越しに米国英語で交わした約2400の双方向の会話から成るデータセットだ。このテストは、スポーツから政治までさまざまなテーマについて交わされた会話を文字化するものだ。

 MicrosoftのテクニカルフェローであるXuedong Huang氏は、次のように述べている。「音響モデリングを改善するため、CNN-BLSTM(Convolutional Neural Network combined with Bidirectional Long-Short-Term Memory:畳み込みニューラルネットワークと双方向長短期記憶の組み合わせ)モデルを追加した。また、複数の音響モデルに基づく予測を組み合わせるアプローチを、フレーム/セノンレベルと単語レベルの両方で取り入れた」

 「さらに、会話セッションの全履歴を使って、会話の次の流れを予測させた。これによって、音声認識システムの言語モデルが強化され、会話のテーマやその場の文脈に有効に適応できるようになった」

 重要な節目を迎えたものの、Microsoftは、さまざまな訛りや話し方を認識するのが機械にはまだ難しく、騒がしい環境ではパフォーマンスが良くないと認めている。

 Microsoftは、文脈を検知して会話をこれまでより正確に文字化するようモデルをトレーニングすることに成功したが、会話の意味を実際に理解するようコンピュータをトレーニングできるまでには、長い道のりがある。
https://japan.cnet.com/article/35106247/

2: 名刺は切らしておりまして 2017/09/01(金) 18:00:32.15 ID:9HmeOqlv.net
日本語も認識出来るの?

引用元:http://anago.2ch.sc/test/read.cgi/bizplus/1504256120/

3: 名刺は切らしておりまして 2017/09/01(金) 18:01:12.68 ID:R4yVnaaq.net
人を超えてるgoogleより下ってこと?

39: 名刺は切らしておりまして 2017/09/01(金) 21:58:04.08 ID:l2BUKukt.net
正直Googleの音声認識には驚かされる
もうあれには勝てんだろうな

51: 名刺は切らしておりまして 2017/09/02(土) 10:20:28.50 ID:dqMQpm9R.net
Googleもよく認識してくれるけど、翻訳で同時通訳させるととたんに駄目になるね。
片方だけの翻訳なら実用的なんだけど。

9: 名刺は切らしておりまして 2017/09/01(金) 18:15:37.88 ID:N4g0wLJD.net
リアルタイム?

28: 名刺は切らしておりまして 2017/09/01(金) 19:27:20.16 ID:tneHcEAu.net
プロ速記者と比べてるけど妥当なの?レベル低くない?

14: 名刺は切らしておりまして 2017/09/01(金) 18:31:31.08 ID:SPZe4Eq7.net
喋んのが面倒だわ
音声認識とか全部オフだ

4: 名刺は切らしておりまして 2017/09/01(金) 18:01:50.10 ID:s8QiJjNr.net
しかしこれだけではワープロの入力には使えない。
音声入力での間違いを訂正するのはひどく面倒だ。

編集機能を含めて音声入力を洗練させる必要がある。

19: 名刺は切らしておりまして 2017/09/01(金) 19:01:28.55 ID:eOqMrji7.net
音が分かっても、意味は分からない。
意味が分からなければ、本当に正しい単語は選べない。

24: 名刺は切らしておりまして 2017/09/01(金) 19:21:09.14 ID:RxDJ+pS0.net
人並みじゃ一度じゃ認識されないな

16: 名刺は切らしておりまして 2017/09/01(金) 18:54:05.40 ID:fyV4cYdm.net
2ちゃんって新しい物についていけないジジイババアばかりだなw

18: 名刺は切らしておりまして 2017/09/01(金) 19:00:38.39 ID:s8QiJjNr.net
>>16
新しいものなら何でも受け入れるアホとは違う。
吟味、批判するのは発展向上のためにも必要なこと。

17: 名刺は切らしておりまして 2017/09/01(金) 18:55:01.26 ID:6yDERbrP.net
そのうちセンサー駆使して言いたいことも勝手に言ってくれたりして

23: 名刺は切らしておりまして 2017/09/01(金) 19:14:44.58 ID:h4oWFMH/.net
 
 
中の人、大変だな
 


26: 名刺は切らしておりまして 2017/09/01(金) 19:24:56.94 ID:NfWBivww.net
どうせ日本語はOCRのように難易度が跳ね上がる

30: 名刺は切らしておりまして 2017/09/01(金) 19:42:21.09 ID:7PrYH/h1.net
日本人よりは遥かに英語リスニング能力高いだろうな

32: 名刺は切らしておりまして 2017/09/01(金) 20:05:01.62 ID:l2X8HciJ.net
ガヤガヤ会話から議事録を書いてくれるまで頑張れ

34: 名刺は切らしておりまして 2017/09/01(金) 20:54:05.17 ID:oJweLitt.net
>>32
すぐになるでしょう、人の能力さえ追い抜けば

低コスト&全会議の【議事録の全記録】はもちろんのこと
→そこから【統計調査】
→パターン認識(事象A→パターンBの大量データ取り込み)による簡単な【未来予測】まで

一気に国内ベンチャーのやれるチャンスが広がるな

35: 名刺は切らしておりまして 2017/09/01(金) 21:04:24.74 ID:huYEzDvT.net
録音しときゃ良いんじゃないか?

38: 名刺は切らしておりまして 2017/09/01(金) 21:50:16.84 ID:CfD5tNkk.net
唇の動きで認識出来たら騒音の中でも使えるな。

59: 名刺は切らしておりまして 2017/09/02(土) 11:52:37.32 ID:h89WKf/T.net
言語解析はともかく、音声解析だけならとっくに実用化されてるんだけどな、日本語は
聾唖者向けに講師の音声を自動でプロットしたり普通に使われ始めてる
最近は手話できない人も多いみたいね

40: 名刺は切らしておりまして 2017/09/01(金) 22:20:36.82 ID:68hgKIII.net
まじか
人から何度も聞き返されるおれとしてはやっとスタートにたったなって感じだ

48: 名刺は切らしておりまして 2017/09/02(土) 06:02:13.29 ID:jSJXibKF.net
CortanaさんもSiriさんもめっちゃ活用してるよ