本サイトは、Wellness(健康で), Wellbeing(幸福な), Well(より良い) Coreなライフスタイルのための美容健康暮らしの総合ポータルサイトです。

機械翻訳

機械翻訳(きかいほんやく、英: machine translation)とは、ある自然言語を別の自然言語に翻訳する変換を、コンピュータを利用して全て(ないし、可能な限り全て)自動的に行おうとするものである。

近年、AIのディープラーニング技術により、急速に成長している分野であり、特定の用途に限った翻訳においては人間の手で補助することで、ある程度の解決がみられるようになっている。今後人々の日常生活における異言間のコミュニケーションに大きな影響を与えることが期待されている。

翻訳業界からはAI脅威論が強くなっている。しかし研究が進むにつれ、言語の複雑さに由来する機械翻訳の限界も指摘されており、人工知能、自然言語処理、ニューラル機械翻訳などの立場では「克服すべき課題は多く,完璧な機械翻訳を期待するのは現実的ではない」と認識されている。

ルールベース機械翻訳

ルールベース機械翻訳(Rule-based Machine Translation:RMT)とは、あらかじめ登録したルールに基づいて翻訳を行なう機械翻訳のこと。ルールとは文法のことであり、文法と言語データベースであるコーパスを照合しながら翻訳文を生成する。
原文の単語を翻訳語の言語に置換した上で翻訳語の言語の文法に沿って並び替えるが、直訳に強いが不自然な翻訳に仕上がる傾向がある。

統計学的機械翻訳

Google翻訳などに代表される「統計的機械翻訳」と呼ばれる、統計学や確率論に基づき訳文を作成する方法です。

 統計的機械翻訳は、異なる2つの言語の文章について、それぞれどの単語同士が意味的に対応する可能性が高いか(翻訳モデル)、原文に対応すると考えられる単語が訳語として自然か(言語モデル)という点を考慮し、訳文を作成する方法です。
 訳文の作成の際には、予め用意された膨大な対訳集のデータを基に構築された二種類のモデル(翻訳モデル及び言語モデル)を用いて、それぞれの確率を求め、最も確率が高いものが原文に対する訳文として選択されます。このため、基本的には対訳集のデータさえあれば、様々な言語に対応が可能です。

 このように、統計的機械翻訳は、統計学や確率論に基づく方法であり、基本的には原文や訳文の文法は不要であるため、文法構造が分からなくても翻訳は可能となります。このため、「英語」と「フランス語やドイツ語」の組合せのように、欧米言語間では既に実用的な域に達しているようです。これは、統計的機械翻訳の仕組みが、文章の冒頭から少しずつ区切り、その都度、最適と思われる訳語を当てはめた文をつなげて訳文を生成するため、そもそも語順が近い言語間での翻訳に向いているためです。

表現学習

表現学習とは、機械学習のタスクの実行に有用な特徴表現を学ぶ手法のことです。画像、音、自然言語、時系列データなどの高次元なデータを、予測タスクを解くことで低次元な特徴表現に変換します。
機械学習の性能はデータの表現に依存するため、従来は人間が試行錯誤して特徴量を設計していましたが、表現学習ではコンピュータが自動で特徴を学習し、獲得した特徴表現を使って目的のタスクを実行できるようにします。

関連記事

本コンテンツは、日本ディープラーニング協会のG検定を想定したコンテンツとなっております。 人工知能の定義 人工知能とは何か  「人工知能(Artificial Intelligence)」:1956年にアメリカで開催され[…]

表現学習で得られる特徴表現は低次元なベクトルである為、演算により分類や推定などのタスクを容易に行えます。また、データと特徴表現の相互変換が可能で、この性質を生かして画像生成や自動翻訳などの手法が開発されています。

フレーム問題

フレーム問題とは、有限の情報処理能力しかないため、今しようとしていることに関係のある情報だけを選択することが難しく、現実に起こりうる問題全てに対処することができないことを示すもの。
1969年にジョン・マッカーシーとパトリック・ヘイズが提唱した人工知能における重要な問題。

チューリングテスト(人工知能ができたかどうかを判定する方法) 

出典:ITMedia

イギリスの数学者アラン・チューリングが提唱:別の場所にいる人間がコンピュータと会話をし、相手がコンピュータだと見抜けなければコンピュータには知能があるとするもの。

チューリングテストは、具体的なソフトウェア開発の目標にもなっている。イライザ(ELIZA)では、精神科セラピストの役割を演じるプログラムで、本物のセラピストと信じてしまう人も現れた。1991年以降、チューリングテストに合格する会話ソフトウェアを目指すローブナーコンテストを毎年開催されている。 

ローブナーコンテスト

チューリングテストに合格する会話ソフトウェアを目指すコンテストで1991年から開催されている

関連記事

過去数年にわたって、ディープラーニングのようなハイテク概念の出現と、GAFAのようないくつかの巨大な組織によるビジネスへの採用がありました。ディープラーニングが世界的に注目されているのには、様々な要因があります。 この記事では、ディ[…]

中国語の部屋

出典:ITMedia

中国語の部屋(Chinese room)とは、チューリングテストへの反論として提起された思考実験である。

 中国語の部屋では、思考実験として、質問者とは別の部屋にいる回答者が「中国語を理解するか否か」を判定するテストを想定する。そこでもし完璧な「中国語質問への回答マニュアル」を使うなどして回答者が中国語の質問にうまく答えられれば、質問した人から見ると回答者はあたかも中国語を理解しているように見えるはずだ(つまりテストに合格するということ)。しかしこれは「中国語を理解している」という意味にはならない。

 それと同様に、チューリングテストに合格したからといって、それは「その機械が考えることができる」つまり「知能を持った機械(=人工知能)である」という意味にはならない、とする反論である。

この思考実験は、1980年に哲学者のジョン・サール(John Rogers Searle)氏の論文『Minds, Brains, and Programs』の中で提案された。それ以来、その反論、その反論の反論と、広く議論されてきており、一連の議論は「中国語の部屋の議論(CRA:Chinese Room Argument)」と呼ばれている。

強いAIと弱いAI 

  • 強いAI:適切にプログラムされたコンピュータは人間が心を持つのと同じ意味で心を持つ。 
  • 弱いAI:コンピュータは人間の心を持つ必要はなく、有用な道具であればよい。

 ジョン・サールは、人の思考を表面的に模倣するような「弱いAI」は実現可能でも、意識を持ち意味を理解するような「強いAI」は実現不可能だと主張。

「中国語の部屋」という思考実験を実施

シンボルグラウンディング問題(記号接地問題)

シンボルグラウンディング問題とは、1990年に認知科学者のスティーブン・ハルナッド:記号(シンボル)とその対象がいかにして結び付くかという問題である。 

人間の場合は、「シマ(Stripe)」の意味も「ウマ(Horse)」の意味もよく分かっているので、本物のシマウマ(Zebra)を初めて見たとしても、「あれが話に聞いていたシマウマかもしれない」とすぐに認識可能。

しかし、コンピュータは「記号(文字)」の意味が分かっていないので、記号が意味するものと結び付けることができない。

身体性

知能が成立するためには身体が不可欠であるという考え。

「外界と相互作用できる身体がないと、概念はとらえきれない」というのが、身体性というアプローチの考え。

知識獲得のボトルネック 

人間が持つ膨大な知識を獲得することの難しさを知識獲得のボトルネックという。機械翻訳が難しい理由は、コンピュータが「意味」を理解してないからである。

2016年11月にGoogleが発表したGoogle翻訳ではニューラル機械翻訳が利用されており、機械翻訳の品質が格段に向上した。ディープラーニングの利用で知識獲得のボトルネックを乗り越え、さらなる性能の向上が期待されている。

ニュートラル機械翻訳

ニューラル機械翻訳とは、人間の脳神経回路を模したニューラルネットワークを利用して単語の連なりから尤度(ゆうど:あてはまる可能性)の高い言葉を選び出す機械翻訳のアプローチで、通常は文全体を一つのまとまりとしてモデル化して訳文を作成します。

特徴量設計

特徴量とは注目すべきデータの特徴を量的に表したもの。

特徴表現学習とは、特徴量を機械学習自身に発見させるアプローチである。特徴量を人間が見つけ出すのは非常に難しいため、この特徴量を機械学習自身に発見させるアプローチを特徴表現学習と呼ぶ。

ディープラーニングは、与えられたデータの特徴量を階層化し、それらを組み合わせることで問題を解く。

 

シンギュラリティー

出典:ITMedia

シンギュラリティー(技術的特異点)とは、人工知能が十分に賢くなり、自分自身よりも賢い人工知能を作るようになった瞬間、無限に知能の高い存在を作るようになり、人間の想像力が及ばない超越的な知性が誕生するという仮説。

こうした脅威に対し、Googleは、イギリスのディープマインド・テクノロジーズ社を買収する際に、社内に人工知能に関する倫理委員会を作った。日本でも人工知能学会において、2014年に倫理委員会が設置されました。

 

レイ・カーツワイル 「$1,000で手に入るコンピュータの性能が全人類の脳の計算性能を上回る時点」「2029年には人工知能が人間よりも賢くなり、シンギュラリティは2045年に到来する」
ヒューゴ・デ・ガリス 「シンギュラリティは21世紀後半に到来する」
イーロン・マスク シンギュラリティに危機感を持ち、非営利組織OpenAIを設立
オレン・エツィオーニ 「シンギュラリティは100万年後に特異点を迎える可能性はある。
しかし、世界制覇すると言う構想は馬鹿げている。」
ヴィーナー・ヴィンジ 「機械が人間の役に立つふりをしなくなる」
スティーブン・ホーキング 「AIの完成は人類の終焉を意味するかもしれない」
関連記事

人工無脳(知識なしでも知性があるように感じる人間心理の不思議)  人工無脳:チャットボット、おしゃべりボットなどと呼ばれているコンピュータプログラム。特定のルール・手順に沿って会話を機械的に処理するだけで、実際は会話の内容を理解して[…]

最新情報をチェックしよう!