【実録】Geminiの議事録作成能力が低下？「3.1 Pro」で見えてきた課題と現時点の最適解

2026年04月15日仕事のこだわり

ここ２、３年ほど、音声ファイルからの議事録作成にAIを活用してきましたが、最近「おや？」と感じることが増えました。特にGemini 3.1 Proにアップデートされてから、重要な内容の欠落や、発言していない内容が含まれる「幻覚（ハルシネーション）」が目立つようになったのです。

最初は自身のプロンプトや音声品質の問題かと思いましたが、調べてみると同様の報告が多数上がっていることが分かりました。

Gemini 3.1 Pro（最新モデル）で指摘されている主な不具合

以前のバージョン（1.5 Proの初期やFlash）と比較して、特に以下の点が劣化しているとの声があります。

情報の欠落（スキップ）: 長尺の音声ファイルにおいて、特定のトピックが丸ごと飛ばされる。
タイムスタンプのズレ: 起こしたテキストと実際の音声時間の整合性が取れなくなる。
YouTube解析の不具合: 以前はスムーズだった動画URLからの分析が「アクセス不可」で失敗する。
精度の不安定化: モデルの複雑化や内部的なリソース制限により、短期記憶の処理や指示の理解が不安定になっている可能性。

特に「言っていないことを書く」という現象は、ビジネス文書である議事録においては致命的です。AIが「良かれと思って」文章を補完したり、前後関係を無理につなげようとしたりする挙動が、かえって仇となっている印象を受けます。

現時点で試すべき「3つの対策」

この「劣化」を感じる状況下で、精度を維持するために有効な手段がいくつか見えてきました。

1. 「Gemini 1.5 Flash」を試す
意外なことに、上位モデルのProよりも軽量モデルの「Flash」の方が、文字起こしや忠実な要約においてWhisperと同等以上の高いパフォーマンスを発揮するという報告があります。処理がシンプルな分、余計な創作（幻覚）が入りにくいのかもしれません。

2. Google AI Studioで「Temperature（温度）」を下げる
通常のチャット画面ではなく「Google AI Studio」経由で利用するのがおすすめです。画面右側の設定で**Temperatureを「0」**に設定してください。これにより、AIの創造性が抑えられ、入力データに対してより忠実で正確な出力を優先させることができます。

3. 「MY Whisper」との併用
最も確実なのは、MY Whisperで一度テキスト化し、そのテキストをGeminiに読み込ませて要約させる方法です。ただし、MY Whisperは実時間に近い処理時間がかかるため、急ぎの案件には向きません。スピードを優先するならGeminiの直接読み込み、精度を極めるならWhisper経由と使い分けるのが賢明です。