コース: ウィークリーAIトピックシリーズ
無料トライアルでこのコースを視聴する
今すぐ登録して、24,700件以上登録されている、業界エキスパート指導のコースを受講しましょう。
Google Geminiとは
今週は Google が開発した 生成 AI サービスである Google Gemini の 基本について解説します。 その概要や ビジネスの現場でどのように役立つのか、 その可能性についても見ていきましょう。 2023 年 12 月にリリースされた Google Gemini は テキスト、画像、音声など 多様なデータ入力に対応する マルチモーダル AI モデルを用いた 生成 AI サービスです。 マルチモーダル対応とは テキストによるプロンプト入力だけでなく 画像や音声など 複数の異なるデータ形式を理解し、 それらを組み合わせることで 一貫性のある出力を生成できることを 意味しています。 これによりビジネスにおいては 文章の作成だけではなく さまざまな用途に応用可能です。 例えば、このように 旅行のプランを写真や、 Google Maps の案内とともに 提案するといった使い方が可能です。 他にもビジネスでは 商品の説明を文章で入力し、 その商品画像を追加することで、 より詳しい商品説明の文章を 生成するといった使い方が可能です。 現在の所、 Google Gemini は Google アカウントで サインインすることで 無料プランでも テキストの生成を利用できます。 なお、以前は 画像生成にも対応していましたが 現在は生成される画像の問題を解消するため 一時的に機能を停止しています。 これについては今後のアップデートで 対応すると考えられています。 これらの生成機能を利用することで クリエイティブなプロジェクトや マーケティング資料の作成などは 迅速かつ容易になり 時間とコストの節約に 寄与することでしょう。 また年内には有料プランに 音声による会話が可能な新機能、 Gemini Live が搭載されると アナウンスされています。 現在は英語のみの対応となっていますが これによりユーザーは AI と 自然な音声で…
目次
-
-
-
Command Aとは3分14秒
-
(ロック済み)
Canva AIとは2分
-
(ロック済み)
Notion AIとは3分21秒
-
(ロック済み)
NotebookLMとは3分13秒
-
(ロック済み)
Perplexity AIとは2分34秒
-
(ロック済み)
Deep Researchとは4分23秒
-
(ロック済み)
Gemma 3とは3分46秒
-
(ロック済み)
ChatGPT 4.5とは4分1秒
-
(ロック済み)
G検定・E検定とは1分56秒
-
(ロック済み)
NVIDIA Cosmosとは1分54秒
-
(ロック済み)
MoE(Mixture of Experts)とは1分50秒
-
(ロック済み)
世界モデルとは2分19秒
-
(ロック済み)
音声基盤モデルとは1分58秒
-
(ロック済み)
セマンティック検索とは2分23秒
-
(ロック済み)
ゼロショット学習とは2分41秒
-
(ロック済み)
事前学習とファインチューニングとは1分47秒
-
(ロック済み)
Google Gemini 2.0とは2分32秒
-
(ロック済み)
Soraとは3分25秒
-
(ロック済み)
ChatGPT Proとは3分53秒
-
(ロック済み)
デジタルヒューマンとは1分37秒
-
(ロック済み)
DeepSeekとは3分42秒
-
(ロック済み)
自動運転とAI2分49秒
-
(ロック済み)
国産生成AI開発の動き2分47秒
-
(ロック済み)
AIaaSとは2分5秒
-
(ロック済み)
GitHub Copilotとは1分28秒
-
(ロック済み)
SLMとエッジAI2分1秒
-
(ロック済み)
ChatGPTのAdvanced Voiceとは3分3秒
-
(ロック済み)
Image FXとは3分21秒
-
(ロック済み)
Runwayとは3分17秒
-
(ロック済み)
Apple Intelligenceとは2分38秒
-
(ロック済み)
LLaMaとは3分8秒
-
(ロック済み)
ニューラルネットワークとは4分10秒
-
(ロック済み)
AIエージェントとは3分5秒
-
(ロック済み)
国産LLMとは2分28秒
-
(ロック済み)
RAGとは2分21秒
-
(ロック済み)
Copilot for Microsoft 365とは2分25秒
-
(ロック済み)
ハルシネーションとは2分28秒
-
(ロック済み)
Claudeとは2分19秒
-
(ロック済み)
プロンプトエンジニアリングとは3分47秒
-
(ロック済み)
GPUとは3分51秒
-
(ロック済み)
AGI(人工汎用知能)とは2分43秒
-
(ロック済み)
Adobe Fireflyとは3分4秒
-
(ロック済み)
大規模言語モデル(LLM)とは4分34秒
-
(ロック済み)
Google Geminiとは4分59秒
-