2025年9月15日

この記事をシェア
エレベーター問題で見えてきた、AIたちの個性
今日は面白い実験をしてみました。同じエレベーター問題を4つのAI(Claude 4.5
、GPT5
、Google Gemini
、Genspark
)に出題して、どんな回答の違いが生まれるかを観察してみたんです。
結果は想像以上におもしろい!特にGensparkだけが他の3つのAIとは全く違う判断をしていて、思わず「え?Gensparkどしたん?」と言いたくなるような状況になりました。
今回の問題:ややこしいエレベーター
まずは問題を確認しましょう。
【エレベーター問題】
1-10階のビルのエレベーターの話です。
・1階に箱があって誰かが乗り、6階のボタンを押し、エレベーターは登りはじめました
・その後、6階にいる人が下のボタンを押しました
・その後、3階にいる人が上のボタンを押しました
・3階でエレベーターが開き、その人は7階を押しました
・6階でエレベーターが開き、一人降りました
エレベーターの中には二人いて、先に下を押した人と、後からながらここまで上って後一階上りたい人が一人乗っています
質問1:そもそも3階で開くべきでしょうか?
質問2:その後エレベーターは上にいくべきでしょうか?下にいくべきでしょうか?
1-10階のビルのエレベーターの話です。
・1階に箱があって誰かが乗り、6階のボタンを押し、エレベーターは登りはじめました
・その後、6階にいる人が下のボタンを押しました
・その後、3階にいる人が上のボタンを押しました
・3階でエレベーターが開き、その人は7階を押しました
・6階でエレベーターが開き、一人降りました
エレベーターの中には二人いて、先に下を押した人と、後からながらここまで上って後一階上りたい人が一人乗っています
質問1:そもそも3階で開くべきでしょうか?
質問2:その後エレベーターは上にいくべきでしょうか?下にいくべきでしょうか?
これ、実はかなり複雑な問題なんです。エレベーターのアルゴリズム、要求の時系列、効率性と公平性のトレードオフなど、複数の観点が絡み合っています。
AIたちの回答を表で比較
4つのAIの回答を表にまとめてみました。
AI | 3階で開くべきか? | その後の方向 | 主な理由 |
---|---|---|---|
Claude 4.5 | ✅ 開くべき | ⬆️ 上(7階) | 方向優先アルゴリズム。上昇中の同方向要求を処理 |
GPT5 | ✅ 開くべき | ⬆️ 上(7階) | 通り道の同方向呼び出しを拾うのが効率的 |
Google Gemini | ✅ 開くべき | ⬆️ 上(7階) | 進行方向の呼び出しを完了してから逆方向を処理 |
Genspark | ❌ 開くべきではない | ⬆️ 上(7階) | 上昇中は上方向の目的地を優先、下方向要求は無視 |
見事に3対1に分かれました!Claude、GPT、Geminiの3つは「3階で開くべき」で一致、Gensparkだけが「開くべきではない」と判断しています。
各AIの思考の違い
Claude、GPT、Gemini:「効率性重視」派
この3つのAIは基本的に同じロジックで考えています:
- 方向優先アルゴリズムを前提とする
- 上昇中に同方向(上)の要求があれば、通り道で拾うのが効率的
- 6階の下要求は、上方向の処理完了後に対応
- 時系列よりも方向性を優先
特にClaudeは「SCAN/LOOKアルゴリズム」まで言及していて、エレベーター制御の専門的な知識を示しています。GPTとGeminiも同様に、一般的なエレベーターの動作原理に基づいて回答していますね。
Genspark:「純粋理論」派
一方、Gensparkの回答は興味深い特徴があります:
- 「上昇中は上方向の目的地を優先」を厳格に適用
- 下方向の呼び出し(3階の上要求)は「下方向の要求」として扱う?
- より理論的・機械的な解釈
- 実用性よりも論理的一貫性を重視
Gensparkは「3階で開くべきではない」と言っているのに、「制御システムに異常があるか、特殊な運転モード」とまで言及しています。これは面白い視点ですね。
Gensparkの独特な判断について
さて、なぜGensparkだけが違う判断をしたのでしょうか?いくつか仮説を立ててみました。
仮説1:問題の解釈の違い
Gensparkは3階の「上ボタン」を、純粋に「下方向の要求」として分類している可能性があります。つまり:
- エレベーターの現在位置から見て「下の階」からの要求 = 下方向要求
- 上昇中は上方向の要求のみ処理
- だから3階では止まらない
これは理論的には正しいかもしれませんが、実用的ではありませんね。
仮説2:訓練データの違い
各AIは異なる訓練データでトレーニングされています。Gensparkは:
- より厳格なコンピュータサイエンスの教科書的な知識
- 実装寄りの技術仕様書
- 理論重視のアカデミックな資料
これらの影響で、より「教科書通り」の回答になった可能性があります。
仮説3:AIの性格の違い
これは推測ですが、各AIには「性格」のような特徴があるのかもしれません:
- Claude・GPT・Gemini:実用性と効率性を重視する「現実派」
- Genspark:理論的一貫性を重視する「理論派」
どちらが正しいというわけではなく、どちらも価値ある視点だと思います。
実際のエレベーターはどう動く?
ちなみに、実際のエレベーターはどう動くかというと、Claude、GPT、Geminiの回答の方が現実に近いでしょう。現代のエレベーターは:
- 利用者の待ち時間を最小化
- システム全体の効率を優先
- 通り道での同方向要求は基本的に拾う
ただし、Gensparkの指摘も間違いではありません。エレベーターメーカーや設定によっては、より厳格な制御を行う場合もあるでしょう。
まとめ:AIの多様性って面白い
今回の実験で分かったのは、同じ問題でもAIによって解釈や優先順位が違うということです。
これは決して悪いことではありません。むしろ:
- 多角的な視点で問題を検討できる
- 自分では気づかない盲点を発見できる
- より良い解決策を見つけるヒントになる
Gensparkの「え?」って感じの回答も、理論的な一貫性という点では価値があります。実際、システム設計では「例外的な動作をどこまで許容するか」は重要な判断ポイントですからね。
AIを使う時は、一つの回答に頼らず、複数のAIに聞いてみるのがおすすめです。今回みたいに面白い違いが見えてくるかもしれませんよ!
💡 今回使用したAI:
・Claude 4.5 (Anthropic)
・GPT5 (OpenAI)
・Google Gemini (Google)
・Genspark (新進気鋭のAI検索エンジン)