画像をタップして拡大する

2022年1月14日

AIは私たちの対話にどのような影響を及ぼしているか

機械翻訳は人間の言語と文化を保護する鍵となる可能性があります。

ニューラルネットワークには、機械による翻訳や言語処理を進化させる秘密の力、すなわちメタファーを理解する能力があります。

「すべての人間の言語はメタファーをベースとします」とHPE Pointnext ServicesのAIおよびデータプラクティス主席研究員であるSenthil Gandhi氏は述べています。「人間は時間を真に視覚化することはできません。それは不可能です。しかしながら私たちはしばしば時間を話題にします」。この際に使用されるのがメタファーであり、時間をお金に例えて「それは時間の浪費だ」、「時間を節約する」といったフレーズが使われます。

Gandhi氏が「メタファーエンジン」と呼ぶニューラルネットワークは、現時点では人間の脳が持つ言語的な柔軟性に及ばないものの、その性能は急速に向上しています。

機械翻訳は、言語や文化の壁を越えたコミュニケーションを大きく促進させると期待されています。また音声アシスタントに質問することでインターネットの集合意識にアクセスできれば、読み書きを覚える前の子供や、読むことに障害のある人々の世界を開くことにもつながります。

とはいえ機械翻訳の課題は、よりスマートなAIの構築だけにとどまりません。人間の言語の多様性やニュアンスを捉えられるようにモデルを訓練するための包括的なライブラリの作成には、膨大な人手と資金が必要です。さらに、音声パターンに影響する障害を持つ人々にも対応できるようにAIを訓練するといった収益化が難しいユースケースでは、必要な注目を集められない可能性もあります。

機械翻訳の可能性を示す一例として、Google翻訳のおかげで、Gandhi氏は共通の言語を持たない庭師と、英語とスペイン語でコミュニケーションをとれるようになりました。「私にとってGoogle翻訳は単に便利なツールに過ぎませんが、庭師にとっては人生を一変させるものとなる可能性があります」とGandhi氏は述べています。

注目される機械翻訳のユースケース

機械翻訳に関して特に緊急性の高いユースケースは、英語が母国語でない人々に、英語が主流の世界でビジネスを行う手段を提供することでしょう。先頃ボストンで実施された職業英語プログラムに関する調査によると、コース修了者は最初の1年間で年収が平均2,621ドルアップし、その後も収入が増え続けていることが判明しました。

とはいえ新たな言語の習得は決して容易ではありません。66万9,000人の英語を母国語とする人としない人の文法学習能力を比較した調査によると、17歳を境に新しい言語を学ぶ能力は次第に低下していきます。人生の後半になってから学習を始めた人が、英語を使いこなせるようになるのは難しく、そうした人々にとって機械翻訳は経済的ライフラインとなる可能性があります。

英語をほとんど、またはまったく話せない人でも業務や取引を英語で行える翻訳ソフトがあれば、収入の増加を期待できます。「機械翻訳によって人生が劇的に変わり得る人は数百万人に達するでしょう」とGandhi氏は述べています。

言語の壁

残念ながら、話者の少ない言語は翻訳ライブラリが限定的なものになりがちです。

「こうしたアルゴリズムの場合、基本的にはデータが多ければ多いほど性能が向上します」とGandhi氏は説明します。「そしてお金が集まるところにデータも集まります」。したがって機械翻訳のためのリソースは、英語を筆頭に、中国語、スペイン語など、収益性の高い言語に集中する傾向があります。モデルの訓練には膨大なデータセットが必要なため、Gandhi氏は自身の母国語であるタミル語のような場合、翻訳が十分なレベルに到達するまでに数十年を要するのではないかと憂慮しています。

ニュアンスはアルゴリズムが不得意とする領域で、人間の介入が必要になるため時間も経費もかかります。タミル語の場合、最初の翻訳者となったのは宣教師たちで、「彼らは多くのニュアンスを見落としていました」とGandhi氏は述べています。「特に難しいのが、ある概念を表す単語が母国語には存在しないケースです」。

その一例として同氏が挙げるのが「雪」で、赤道付近で発展した言語であるタミル語には「雪を表す単語がありません」。現在タミル語圏の人々は雪を表すのに雫を意味する単語を使っていますが、翻訳により何らかのニュアンスが失われるのは避けられません。対照的にイヌイット語やアイスランド語には、さまざまな種類の雪を表す何百もの単語が存在します。このような概念を文化の壁を超えて翻訳するのはAIにとって難題です。

Gandhi氏が指摘するように、タミル語が独立した言語として進化を始めたのは5,000年の昔にさかのぼります。「言語は5,000年にわたる人々の経験を伝えるものです」と同氏は説明します。「民族の歴史は彼らが使用する言葉の中に織り込まれていますが、それらは急速に失われつつあります」。

もう1つの大きな障害となるのが、(少なくとも現在の技術力では) エネルギーの問題です。約1年前に、Gandhi氏は人間の脳の機能に匹敵するニューラルネットワークの構築に必要なエネルギー量を概算してみました。私たちの脳には約1,000億個のニューロン (神経細胞) が存在します。最大のニューラルネットワークのパラメーターは約2億で、人間の脳に近いレベルを実現するには、現時点では途方もないエネルギーが必要です。機械翻訳が完璧なものになることはないでしょうが、絶えず進化を続けており、アルゴリズムが成熟し、言語データセットにニュアンスが含まれるようになるにつれて、その精度はより一層高まると期待されています。

「(自然言語処理) ツールやモデルを構築しなければ、これらの言語は初めから存在しなかったかのように消失してしまう恐れがあります」
プレトリア大学上級講師、VUKOSI MARIVATE氏

言語や文化の保護にNLPを活用

プレトリア大学コンピューターサイエンス学部の上級講師であるVukosi Marivate氏は、「インターネットは今や非常にモノリンガルになりつつある」と指摘します。Marivate氏は「アフリカ人によるアフリカのための草の根NLPコミュニティ」と称されるMasakhaneの創設者の1人です。Masakhaneは自然言語処理ツールをオープンソースで作成することで参入障壁を軽減し、より多くの人々の参加を促しています。2019年に設立されたこのプロジェクトは、アフリカ35カ国で1,000人以上のコントリビューターが参加する一大プロジェクトへと成長しました。

Masakhaneのコントリビューターらは、ソース言語とターゲット言語をパイプラインに入れて、アフリカのさまざまな言語を処理できるようにモデルを訓練しています。これは壮大な取り組みです。アフリカには約2,000の言語が存在し、その多くはモデルの訓練に必要な翻訳ライブラリが十分ではありません。

「こうしたツールやモデルを構築しなければ、これらの言語は初めから存在しなかったかのように消失してしまう恐れがあります」とMarivate氏は述べています。同氏が指摘するように、言語にはそれを発展させた民族の歴史や文化が織り込まれており、1つの言語が消えることで私たちはそれ以上に大きなものを失うことになります。

Masakhaneプロジェクトの中核にあるのが、言語だけでなく文化も翻訳するという姿勢です。

Marivate氏は、ある (翻訳不可能な) アフリカのことわざを例に挙げて、言語を理解するために、まずはその文化の中に身を置かなければならない場合があると説明します。そのためMasakhaneのコントリビューターには、言語に込められた文化的意味合いを把握できるように、データサイエンティストに加えて言語学者や社会学者も含まれています。

Googleのような大企業が、莫大なリソースを投じてマイナーな言語の翻訳ライブラリを作成しても、ビジネスとして成立しないでしょう。そこでGandhi氏はこうした言語遺産を保護するための資金として助成金の重要性を訴えています。Masakhaneは、アフリカの6つの言語に対応した翻訳ツールの構築など、複数のプロジェクトに助成金を活用していますが、こうした支援をさらに拡充させる必要があるとGandhi氏は指摘します。

機械翻訳が人間の言語能力に匹敵する日は来るか

現時点でNLPは人間の翻訳者に代わり得るものではなく、アシスタントとしての役割を担っています。機械翻訳の弱点を示す最近の例として、Netflixの大人気タイトルである韓国の「イカゲーム」シリーズの不正確な字幕をめぐる騒動が思い出されます。Netflix社はバージニア工科大学と共同で、ブラックボックス型の機械翻訳を改善する自動前処理の開発に取り組んできました。しかしながらAIによる字幕生成を容易にするための言語の簡略化は、異なる文化圏の物語を理解するために必要なコンテキストを取り除くことにもつながります。

またGandhi氏は自宅で使用しているAIアシスタントの限界として、自身のタミル語アクセントの英語が理解されにくいことを挙げています。Google HomeやAlexaに命令を理解させるためには、厳しい口調での指示が必要です。

「それは相手が人間であったら無礼になるような指示の仕方です」とGandhi氏は説明します。さらに悪いことに彼の幼い息子は、AIアシスタントから答えを得るには怒鳴るのが最良であることを観察によって学んでしまいました。とはいえGandhi氏は、Googleに命令することが息子のコミュニケーション能力に悪影響を及ぼすとは考えていません。子供は人間に対してそのような話し方をしてはいけないことをすぐに学んだからです。

人間の脳は、たとえ幼い子供であっても、相手が人間かAIかによって話し方を変えるという複雑な状況に対応できます。シアトルの研究者らは、「bungo」という造語を言うとシミュレーションされたAIの発話が速くなることを子供たちに教える実験で、このことを確認しました。追跡調査により子供たちは、人間は「bungo」という単語に対してAIのようには反応しないことを理解していることが明らかになりました。

「子供とAIの関係性が進化していくのを見るのは非常に興味深い体験でした」とGandhi氏は述べています。「息子は最初のうち、ただの機械としてAIを扱っていましたが、すぐにそれが信頼できる情報源であることを理解しました」。

このように人間は音声AIに害されることなく最大限に活用することが可能です。さらにGandhi氏は機械翻訳やNLPは、この10年間で飛躍的な進化を遂げたとはいえ、いまだ蒸気時代の段階にあると考えています。これは将来的にはジェット時代の到来、すなわちより高速かつ的確な機械翻訳が期待できることを意味します。機械翻訳はすでに私たちの対話方法を変えつつあり、また人類が長い年月をかけて発展させてきた何千ものコミュニケーション手段を保護するための重要なピースとなっています。

この記事/コンテンツは、記載されている特定の著者によって書かれたものであり、必ずしもヒューレット・パッカード エンタープライズの見解を反映しているわけではありません。

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。

enterprise.nxt
ニュースレターのご登録

enterprise.nxtから最新のニュースをメールで配信します。