全47都道府県の地域特性データをAIで収集した話
位置情報ゲームに地域の個性を — 北海道から沖縄までの特性をAIで整理
位置情報ゲームに「地域の個性」を
wagahiアプリは位置情報ゲームです。ユーザーが実際にいる場所によって、出会うキャラクターや会話の内容が変わる。これがwagahiの核心的な体験です。
しかし、「場所によって体験が変わる」を実現するためには、各地域の特性データが必要です。北海道と沖縄では気候も文化も食べ物も違う。その違いをキャラクターの会話や性格に反映させるために、全47都道府県の地域特性データを体系的に収集する必要がありました。
スポット地域特性データ調査ツールの構築
47都道府県分のデータを手動で収集するのは現実的ではありません。そこで、AIを活用した地域特性データ調査ツールを構築しました。
ツールの仕組み
- データ定義: 各都道府県について収集する項目を定義(気候、名産品、観光名所、方言、文化的特徴、歴史的背景など)
- AI収集: AIに各都道府県のプロフィールを生成させ、定義した項目に沿って構造化データを出力
- データ検証: 生成されたデータの正確性を人間がレビュー・修正
- DB格納: 検証済みデータをPostgreSQLに格納
収集したデータ項目
各都道府県について、以下のカテゴリのデータを収集しました。
- 基本情報: 県庁所在地、人口規模、地理的特徴
- 気候特性: 気温帯、降水量、四季の特徴
- 文化・風土: 方言の特徴、祭り、伝統工芸
- 名産品: 農産物、海産物、郷土料理、銘菓
- 観光資源: 名所旧跡、自然景観、温泉
- キャラクター生成用特徴: その地域らしい性格特性、話し方のヒント
47都道府県プロフィールの自動収集
ツールを使って全47都道府県のプロフィールを一括生成しました。AIが生成するデータは概ね正確でしたが、いくつかの修正が必要でした。
修正が必要だったケース
- 統計データの古さ: 人口データなど、AIの学習データが最新でない場合がある
- ステレオタイプへの偏り: 特定の都道府県について、ステレオタイプ的な記述に偏る傾向
- 網羅性の偏り: 有名な県は詳細だが、知名度の低い県は情報が薄い
これらは人間のレビューで修正しました。AIが生成した草案を人間が検証・修正するという、AI駆動開発の基本サイクルがここでも有効でした。
スポット管理・アルバム機能の実装
地域特性データの収集と並行して、Ver2_01〜Ver2_02のスポット管理機能とアルバム機能の実装も進めました。
スポット管理機能
ユーザーが訪れた場所(スポット)を管理する機能です。
- GPS座標からスポットを自動登録
- スポットに紐づく地域特性データの表示
- 訪問履歴の記録と表示
- スポット一覧のフィルタリング・ソート
アルバム機能
擬人化したキャラクターの画像をアルバムとして管理する機能です。
- キャラクター画像のギャラリー表示
- 撮影場所・日時による分類
- お気に入り機能
84タスク100%完了
スポット管理とアルバム機能の設計書改定→実装→結合試験まで、全84タスクを100%完了しました。設計書分割が完了した後だったため、関連する設計書ファイルのみを参照しながらの効率的な開発が実現できました。
地域特性データがもたらす体験の変化
47都道府県のデータが揃ったことで、wagahiアプリの会話体験が大きく変わりました。
たとえば、北海道でキャラクターを生成すると、そのキャラクターは北海道の気候や名産品に詳しく、北海道らしい話し方をする。京都で生成すれば、歴史的な知識を持ち、はんなりとした会話をする。
地域特性データは「キャラクターの個性の種」です。同じAIモデルでも、入力する地域特性データが異なれば、まったく異なる個性のキャラクターが生まれる。これこそが位置情報ゲームの醍醐味です。
まとめ
47都道府県の地域特性データ収集は、手動では膨大な作業量になるところを、AIの力を借りて効率的に完了できました。同時に、AI生成データの限界(古い統計、ステレオタイプ、網羅性の偏り)も学びました。
AIは「最初の80%」を高速に生成し、人間が「残りの20%」を検証・修正する。この役割分担は、データ収集でもコード生成でも変わりません。
本記事は2026年2月時点の開発状況に基づいています。
著者: 株式会社シーテン — インフラ系から宇宙関連システムまで20年以上の開発経験を持つ技術者集団。2025年より生成AI・AIエージェントを活用したAI駆動開発に本格参入し、自社プロダクト「wagahi」の開発を通じて実践知見を蓄積中。
関連記事:
投稿者プロフィール





