【実録】Geminiの議事録作成能力が低下?「3.1 Pro」で見えてきた課題と現時点の最適解

2026年04月15日 仕事のこだわり

ここ2、3年ほど、音声ファイルからの議事録作成にAIを活用してきましたが、最近「おや?」と感じることが増えました。特にGemini 3.1 Proにアップデートされてから、重要な内容の欠落や、発言していない内容が含まれる「幻覚(ハルシネーション)」が目立つようになったのです。

最初は自身のプロンプトや音声品質の問題かと思いましたが、調べてみると同様の報告が多数上がっていることが分かりました。

Gemini 3.1 Pro(最新モデル)で指摘されている主な不具合

以前のバージョン(1.5 Proの初期やFlash)と比較して、特に以下の点が劣化しているとの声があります。

  1. 情報の欠落(スキップ): 長尺の音声ファイルにおいて、特定のトピックが丸ごと飛ばされる。

  2. タイムスタンプのズレ: 起こしたテキストと実際の音声時間の整合性が取れなくなる。

  3. YouTube解析の不具合: 以前はスムーズだった動画URLからの分析が「アクセス不可」で失敗する。

  4. 精度の不安定化: モデルの複雑化や内部的なリソース制限により、短期記憶の処理や指示の理解が不安定になっている可能性。

特に「言っていないことを書く」という現象は、ビジネス文書である議事録においては致命的です。AIが「良かれと思って」文章を補完したり、前後関係を無理につなげようとしたりする挙動が、かえって仇となっている印象を受けます。

現時点で試すべき「3つの対策」

この「劣化」を感じる状況下で、精度を維持するために有効な手段がいくつか見えてきました。

1. 「Gemini 1.5 Flash」を試す
意外なことに、上位モデルのProよりも軽量モデルの「Flash」の方が、文字起こしや忠実な要約においてWhisperと同等以上の高いパフォーマンスを発揮するという報告があります。処理がシンプルな分、余計な創作(幻覚)が入りにくいのかもしれません。

2. Google AI Studioで「Temperature(温度)」を下げる
通常のチャット画面ではなく「Google AI Studio」経由で利用するのがおすすめです。画面右側の設定で**Temperatureを「0」**に設定してください。これにより、AIの創造性が抑えられ、入力データに対してより忠実で正確な出力を優先させることができます。

3. 「MY Whisper」との併用
最も確実なのは、MY Whisperで一度テキスト化し、そのテキストをGeminiに読み込ませて要約させる方法です。ただし、MY Whisperは実時間に近い処理時間がかかるため、急ぎの案件には向きません。スピードを優先するならGeminiの直接読み込み、精度を極めるならWhisper経由と使い分けるのが賢明です。

まとめ:AIは「育てる」段階から「使い分ける」段階へ

AIモデルは常に進化していますが、アップデートが必ずしもユーザーにとっての「改善」になるとは限りません。コストやリソースの兼ね合いで、内部的な制限がかかることもあります。

「全自動で完璧」を期待しすぎず、モデルの特性(Pro vs Flash)を見極め、設定を追い込む。そんな試行錯誤が、今のAI活用には不可欠なようです。同じような違和感を抱えている方は、ぜひ一度「AI Studioでの設定変更」や「モデルの切り替え」を試してみてください。

Copyright c syshan.jp all rights reserved.