Technology(技術)

AI(機械学習)は、過去に失われた言語を翻訳する

ある研究によると、歴史的に過去に存在していた言語のほとんどが話されておらず、残っている言語の少なくとも半数も次の100年で消滅すると予測されている(少数民族など)。

そして、原則として、話し手がいなくなり、失われた言語を解読することは困難を極める

失われた言語の解読に成功した例としては、古代エジプト(紀元前3200年頃~)で使用されていた「ヒエログリフ」が有名だ。

ヒエログリフ
Image by pixabay


このヒエログリフの解読成功の理由は、エジプトのロゼッタで1799年に発見された石版「ロゼッタ・ストーン」の発見にある。

ロゼッタ・ストーンには、上から順に、古代エジプトのヒエログリフ、古代エジプトのデモティック、ギリシア語の3つの言語を用いて「同じ内容の文章」が記されている。
そして、ギリシア語は現在も使用されているため、これら言語の関係を比較することによって、ヒエログリフの解読を偶然に成功できた。

ロゼッタストーン
Image by Wikipedia

しかし、比較するべき対象の言語が不明な言語を解読することは困難を極める
そこで、MITのコンピューター科学人工知能研究所(CSAIL)の研究者は、AIを用いて失われた言語を解読できるシステムを開発し、MITの公式HPとコーネル大学の公式HPにその内容を掲載した。

このシステムは、「他の言語との関係が分からなくても、失われた言語を自動的に解読できる」とのこと。

このシステムは、言語間の関係はアルゴリズムによって推測される。
このシステムの原理は、言語は予測可能な方法でのみ進化するという歴史的事実など、歴史言語学からの洞察に基づいたいくつかの予測を利用しているとのこと。

このシステムを用いて、研究チームは、紀元前7世紀から1世紀頃に西ヨーロッパの先住民によって話されていたイベリア語の解読に挑んだ。
なお、イベリア語は、現代のバスク語との類似性が議論されていた。

しかし、このシステムは、バスク語とラテン語は他の言語よりもイベリア語に近かったが、それでも違いが大きすぎて「イベリア語とバスク語との関連性は無い」との結論を導き出した。

今後、研究チームは、言語学者が数十年にわたって避けてきた多くの失われた言語を解読することを目標としているとのこと。

人生の意味として、「生きた証」を残すことを望む人もいる。
そして、古代の人々が「生きた証」は、口伝による伝説や言語(文字)も通じて、世代を経て伝承される。

しかし、悲しい現実として、それらの多くは死語となり、現代に残っていても完全な解読が出来ずにいる。
(例、プロシア語、フリュギア語、トカラ語など)

そして、AIはこの悲しい現実を変える救世主となるかもしれない。

%d人のブロガーが「いいね」をつけました。