AIキャラクターの「画一化問題」をプロンプト設計で解決した話 — コストゼロで多様性42%向上

はじめに

\n\n

「同じ地域で3体のAIキャラクターを作ったら、全員が同じ話をし始めた」

\n\n

当社が開発中の位置情報連動AIアプリ「wagahi」で、この問題に直面しました。東京で郵便ポスト・狛犬・自動販売機を撮影して3体のキャラクターを生成したところ、地域の歴史を聞くと3体とも「徳川家康が1590年に江戸に入府して…関東大震災…東京オリンピック…」と、まるでコピーしたかのような同じ年表を暗唱したのです。

\n\n

本記事では、この「画一化問題」をAIの追加コストゼロで解決した技術的アプローチについて解説します。

\n\n

背景:3層データソースモデルと画一化の構造的原因

\n\n

wagahiでは、ユーザーがスマートフォンのカメラで撮影した物体をAI(Google Gemini API)が擬人化し、位置情報に基づいた会話を行うキャラクターを生成します。

\n\n

キャラクターの会話に地域性を持たせるため、以下の3層データソースモデルを採用しています。

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

データソース 寄与率 状態
層1 LocationSpot(特定スポット情報) 0% 主要スポット未登録
層2 PrefectureProfile(47都道府県プロファイル) 60〜70% 全県登録済み
Geminiベース知識 30〜40% 食材名・人物名等を補完

\n\n

問題の本質は構造的でした。同じ都道府県で複数キャラクターを生成すると、全員に同じPrefectureProfileデータが注入されます。キャラクターの口調や性格は異なっていても、「語る内容」が同じデータに基づくため、地域の話題になると画一的な応答が生まれていたのです。

\n\n

最初の仮説:Thinking機能で解決できるか?

\n\n

Google Gemini APIには「Thinking」機能があり、応答生成前にAI内部で推論プロセスを実行します。この機能を有効にすれば、同じデータからでも異なる側面を引用する多様性が生まれるのではないか——これが最初の仮説でした。

\n\n

検証:6地域×3体=18体の比較試験

\n\n

Thinking有効(budget=8192)とThinking無効(budget=0)の2条件で、各18体のキャラクターに4つの定型質問を送信し、応答を比較しました。

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

質問 Thinking有効 Thinking無効 差異
Q1: 場所について教えて 地域固有情報が豊富 汎用的な表現 あり
Q2: 自分自身について 個性的 個性的 差なし
Q3: 歴史や文化は? 具体的な年号・人名 抽象的な表現 あり
Q4: フレンチトーストは? キャラ個性発揮 キャラ個性発揮 差なし

\n\n

コストの壁

\n\n

Thinking有効化の効果はQ1・Q3で確認できましたが、コストが4.6倍に増加するという大きなトレードオフがありました。

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

設定 1往復コスト 年間コスト(100往復/日)
Thinking有効 ¥0.423 ¥15,228
Thinking無効 ¥0.092 ¥3,312

\n\n

さらに、Q2・Q4では差がないことから、Thinking機能は地域情報の引用多様化には効果があるが、キャラクター個性の発揮には寄与しないことが判明しました。

\n\n

コスト4.6倍を払ってQ1・Q3だけを改善する価値があるのか? 別のアプローチを検討することにしました。

\n\n

解決策:プロンプト設計の改善

\n\n

画一化の原因を改めて分析すると、問題は「データが同じ」ことではなく、AIへの指示が曖昧だったことにありました。

\n\n

改善前のプロンプト

\n\n

``

\n\n

※スポット情報がある場合、会話に自然に取り入れて、

\n\n

その土地ならではの話題を提供してください。

\n\n

歴史や文化の話題はキャラクターの性格に合った形で紹介してください。

\n\n`\n\n

「自然に取り入れて」「性格に合った形で」は人間にとっては理解できる指示ですが、AIにとっては曖昧すぎます。結果として、AIは「最も無難な方法」=PrefectureProfileデータをそのまま引用する方法を選択していたのです。

\n\n

改善後のプロンプト(3つの具体的ルール)

\n\n`\n\n

※スポット情報の活用ルール:

\n\n

1. あなた自身の視点・役割・経験を通して地域の話題を語ること。

\n\n

歴史データをそのまま引用するのではなく、

\n\n

あなたがその場所で見てきたこと、感じてきたこととして語ること

\n\n

2. 同じ地域でも、あなたの個性(物体としての特性)に関連付けた

\n\n

独自の切り口で語ること。

\n\n

他のキャラクターとは異なる視点を持つこと

\n\n

3. 地名・人物名・年号等の具体的な固有名詞を1〜2個含めること。

\n\n

「祭り」「伝統」「人々の営み」だけの抽象的な応答にしないこと

\n\n``\n\n

ポイントは、「何をすべきか」だけでなく「何をすべきでないか」も明示したことです。ルール1では「データをそのまま引用するな」、ルール3では「抽象的な応答にするな」と、AIが陥りやすいパターンを具体的に禁止しています。

\n\n

検証結果:+42ポイントの改善

\n\n

改善版プロンプトをThinking無効(budget=0)のまま適用し、3地域×3体=9体で検証しました。

\n\n

東京での具体例

\n\n改善前(3体とも同じ応答):\n\n

「この辺りは、徳川家康公が江戸に入府されて以来、日本の歴史の中心として発展を遂げてきた場所でございます。1923年の関東大震災や1945年の東京大空襲にも見舞われましたが、不死鳥のように復興を遂げてきました…」

\n\n改善後(3体それぞれ異なる応答):\n\n

    \n\n

  • 郵便ポスト: 「色とりどりの着物を着た方々が、季節ごとの祭りで賑わっていたのを覚えています。春には桜が満開になり、人々がお弁当を広げて楽しそうにしていた姿は、今でも私の心に温かく残っています」
  • \n\n

  • 狛犬: 「古くからこの土地を見守ってまいりました。人々の間に息づく助け合いの心には、いつも静かな感銘を受けております」
  • \n\n

  • 自動販売機: 「比較的新しい時代のことでございますので、深い歴史について詳細をお話しできるほどの知識は持ち合わせておりません」
  • \n\n

\n\n

自動販売機が「自分は新しい存在だから歴史は詳しくない」と答えたのは、ルール1(自分自身の視点で語る)が効果的に機能した結果です。

\n\n

数値的な改善

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

指標 改善前 改善後 改善幅
Q1(場所)平均スコア 22% 65% +43pt
Q3(歴史・文化)平均スコア 20% 62% +42pt
総合平均 21% 63% +42pt

\n\n

技術的な知見:プロンプト設計の3原則

\n\n

今回の経験から得られた、AIプロンプト設計の実践的な教訓をまとめます。

\n\n

1. 「曖昧な美辞」よりも「具体的な禁止事項」

\n\n

「自然に」「性格に合った形で」といった美辞麗句は、AIにとっては解釈の余地が大きすぎます。代わりに「データをそのまま引用するな」「抽象的な応答にするな」という具体的な禁止事項の方が、行動を制約し、結果として多様性を生み出します。

\n\n

2. 「コンテキストの差異」がなくても「視点の差異」で多様性は作れる

\n\n

同じデータ(PrefectureProfile)を注入しても、「どの視点から語るか」を指定することで、全く異なる応答が生まれます。データの多様化はコストがかかりますが、視点の多様化はプロンプト1行で実現できます。

\n\n

3. コスト最適化は「高い機能を使わない」ことから始まる

\n\n

Thinking機能は強力ですが、4.6倍のコストに見合う効果があるかを冷静に検証すべきです。今回のケースでは、プロンプト改善(コスト0)がThinking有効化(コスト4.6倍)と同等以上の画一化緩和効果を発揮しました。

\n\n

今後の展望

\n\n

プロンプト改善で画一化の大部分は解決しましたが、「地域固有情報の充実」には別のアプローチが必要です。

\n\n

当社では、都道府県単位のPrefectureProfileに加え、市区町村レベルの地域情報(municipality_profiles)の導入を計画しています。これにより、同じ大阪府でも「堺市」と「大阪市中央区」で異なる地域情報が注入され、画一化をデータレベルで根本解決できます。

\n\n

また、特定のスポット(神社仏閣、名所旧跡など)に近づくとスポット固有の情報が注入される層1 LocationSpotの拡充も進めていく予定です。

\n\n

まとめ

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

\n\n

アプローチ コスト 効果
プロンプト改善 0 +42pt(即効性あり)
Thinking有効化 4.6倍 地域固有情報のみ改善
データ拡充(中期) 根本解決(計画中)

\n\n

AIアプリケーション開発において、「AIモデルの能力に頼る」前に「指示の精度を上げる」ことの重要性を、改めて実感した事例でした。

\n\n

*本記事で紹介した「wagahi」は、株式会社シーテンが開発する位置情報連動AIキャラクターアプリです。*

\n\n

*技術的なご質問やコラボレーションのご相談は、お気軽にお問い合わせください。*

投稿者プロフィール

Mark4
Mark4