コース: ウィークリーAIトピックシリーズ
無料トライアルでこのコースを視聴する
今すぐ登録して、24,700件以上登録されている、業界エキスパート指導のコースを受講しましょう。
世界モデルとは
今週はデジタル上に 世界の仕組みを表現する 世界モデルについて解説します。 世界モデル、あるいは世界基盤モデルとは、 AI が現実世界の仕組みを学習し、 AI の内部に世界の仮想的なモデルを 構築するための技術や そのコンセプトを指すとされています。 人間が経験によって世界を理解し、 次に何が起こるのかを予測したり、 自律的に判断できるのと同じように、 AI も現実世界の環境や 物理法則などを学習して 世界モデルを持つことで、 未知の状況に対して 対応しやすくなるのではないかと 考えられています。 世界モデルの研究は、 様々な場所で進められています。 例えば、 Google DeepMind では、 テキストや画像から インタラクティブな 3D 世界を 生成できる Genie 2 があります。 また NVIDIA は、 自動運転やロボットに搭載するための 世界モデル、 Cosmos の発表を行いました。 日本国内でも 自動運転用の世界モデル、 Terra を開発するチューリングなど、 多くの研究が進められています。 汎用性が高い世界モデルを構築するには、 膨大なデータや 学習の最適化が必要となりますが、 今後の AI の発展にとって、 世界モデルは 非常に重要な要素となると考えられます。 例えば、仮想空間では、 実際に試さなくても、 もしこの行動を取ったらどうなるのか という試行錯誤を高速に シミュレーションすることができます。 つまり AI の学習自体も、 時間的な制約を受けにくくなり、 発展するスピードが速くなることが 期待できるのです。 世界モデルはすでに 自動運転やロボット制御への 応用が進められていますが、 それ以外にも、ゲームのシミュレーションや 市場や株価の分析、さらには 経済の動きや未来の天気の予測など 複雑系の問題に対しても 貢献できる可能性を秘めています。 AI が現実世界を理解し、 未来を予測しながら適切に…
目次
-
-
-
Command Aとは3分14秒
-
(ロック済み)
Canva AIとは2分
-
(ロック済み)
Notion AIとは3分21秒
-
(ロック済み)
NotebookLMとは3分13秒
-
(ロック済み)
Perplexity AIとは2分34秒
-
(ロック済み)
Deep Researchとは4分23秒
-
(ロック済み)
Gemma 3とは3分46秒
-
(ロック済み)
ChatGPT 4.5とは4分1秒
-
(ロック済み)
G検定・E検定とは1分56秒
-
(ロック済み)
NVIDIA Cosmosとは1分54秒
-
(ロック済み)
MoE(Mixture of Experts)とは1分50秒
-
(ロック済み)
世界モデルとは2分19秒
-
(ロック済み)
音声基盤モデルとは1分58秒
-
(ロック済み)
セマンティック検索とは2分23秒
-
(ロック済み)
ゼロショット学習とは2分41秒
-
(ロック済み)
事前学習とファインチューニングとは1分47秒
-
(ロック済み)
Google Gemini 2.0とは2分32秒
-
(ロック済み)
Soraとは3分25秒
-
(ロック済み)
ChatGPT Proとは3分53秒
-
(ロック済み)
デジタルヒューマンとは1分37秒
-
(ロック済み)
DeepSeekとは3分42秒
-
(ロック済み)
自動運転とAI2分49秒
-
(ロック済み)
国産生成AI開発の動き2分47秒
-
(ロック済み)
AIaaSとは2分5秒
-
(ロック済み)
GitHub Copilotとは1分28秒
-
(ロック済み)
SLMとエッジAI2分1秒
-
(ロック済み)
ChatGPTのAdvanced Voiceとは3分3秒
-
(ロック済み)
Image FXとは3分21秒
-
(ロック済み)
Runwayとは3分17秒
-
(ロック済み)
Apple Intelligenceとは2分38秒
-
(ロック済み)
LLaMaとは3分8秒
-
(ロック済み)
ニューラルネットワークとは4分10秒
-
(ロック済み)
AIエージェントとは3分5秒
-
(ロック済み)
国産LLMとは2分28秒
-
(ロック済み)
RAGとは2分21秒
-
(ロック済み)
Copilot for Microsoft 365とは2分25秒
-
(ロック済み)
ハルシネーションとは2分28秒
-
(ロック済み)
Claudeとは2分19秒
-
(ロック済み)
プロンプトエンジニアリングとは3分47秒
-
(ロック済み)
GPUとは3分51秒
-
(ロック済み)
AGI(人工汎用知能)とは2分43秒
-
(ロック済み)
Adobe Fireflyとは3分4秒
-
(ロック済み)
大規模言語モデル(LLM)とは4分34秒
-
(ロック済み)
Google Geminiとは4分59秒
-