2022年10月25日
人工知能(AI)の進化が幅広い研究分野で一段と加速しています。
2022年8月,米Google社は人間の曖昧なリクエストを理解し、ロボットの行動計画を立案する「PaLM-SayCan」を発表しました。「コーラをこぼしたから、何か掃除するものを持ってきて?」という問いに対して、PaLM-SayCanは『スポンジを探し,見つけ、拾い、飲み物をこぼした人のところに持っていく』と答えます。これまでは人間がロボットに理解できるようリクエストする必要がありましたが,いよいよロボットの方から人間に合わせてくれる時代がやって来ました。
一方,イラストレーターの間では、画像生成AIである「Midjourney」や「Stable Diffusion」が話題になっています。これらの特徴は、ユーザーがどんな画像を生成したいかを文章に書いて指示できることです。Stable Diffusionはオープンソースとして公開されており、ユーザーが画像生成AIを気軽に楽しめる環境が整いつつあります。
実際に「monsters in a subway station」と入力すると,こんな画像が生成されました。
生物学や製薬の分野では、英ディープマインド社が開発したタンパク質の立体構造を予測する「AlphaFold2」が注目されています。同社は2022年7月、2億種ものタンパク質の立体構造の予測を終え、構造データベースとして整備したと発表しました。これにより、存在しうるほぼ全てのタンパク質の立体構造をAIが予測したことになり、医薬品開発の大幅な高速化が期待されています。
これらAI開発の原動力となっているのが「自己注意機構(データのどこに着目すべきかをデータの内容に応じて変化させる仕組み)」を取り入れた「Transformer」をベースにした「言語モデル」の巨大化と,「マルチモーダル化」です。巨大言語モデルがテキストデータばかりでなく、画像の「意味」を扱えるようになったことで、画像生成AIはテキストが意味する画像を生成することが可能になりました。一方、「AlphaFold2」はタンパク質の立体構造の表現にTransformerベースの「Evoformer」を使うことで性能向上を図っています。このように多方面で活用されているTransformerですが、その基本構造はニューラルネットワークアーキテクチャーであり、その理解には「深層学習」の理解を必要とします。
2022年8月、本学の「GIKADAI 数理データサイエンスAI教育プログラム」が、文部科学省から正式に認定されました<CITEの当該ページ>。学部1,2年生は「リテラシーレベルプラス」を,学部3,4年生からは「応用基礎レベル」を学ぶことができます。深層学習については「データサイエンス演習応用」(4年次前期、全系対応)の中で学ぶことができます。皆さんも最新のAI技術をより深く理解するために、認定教育プログラムを履修してみてください。
IT活用教育センター 准教授 原田 耕治
関連記事
2023年8月10日