推論型生成AIの進歩を確認するため,日経土曜版第四週の数独(ナンバープレース・超難問)の pdf ファイルを読んで解かせてみた。
Q(koshix):
数独(https://ja.wikipedia.org/wiki/数独)というパズルの問題です。
添付ファイルの問題があります。数字の部分が与えられています。
このパズルを解いて,赤いアルファベットのA,B,C,D,E,F,G,H,K,L,M,N,P,R,S,T,U
に入る数字を求めてください。
A(ChatGPT o3):
(思考時間24秒)
申し訳ありません。
添付の PDF は画像形式で格子線が読み取れず、現在の抽出テキストだけでは 9 × 9 マスの正確な配置(各行・各列・3 × 3 ブロック内で数字と赤いアルファベットがどう並んでいるか)が判別できません。
数独は初期配置が 1 マスでもずれると解が変わってしまいますので、まずは盤面を確定させる必要があります。
お手数ですが、次のどちらかの方法で初期配置を共有していただけるでしょうか。
1.テキストで盤面を示す
例:
行1: _ 5 _ | 2 _ | _ _ _
行2: _ 8 _ | 9 _ | _ _ _
…
_(または 0)= 空マス、A〜U = 赤いアルファベット、数字 = 固定値。行ごとに 9 個、区切りは空白やカンマなどで結構です。
2.もう一度画像をアップロード
盤面全体がはっきり写る JPEG/PNG を上げていただければ、こちらで画像解析して配置を取り込みます。
盤面がはっきり分かり次第、プログラムで解を一意に導き、A ~ U それぞれに入る数字を丁寧にご説明します。よろしくお願いします。
図:pdfファイルで添付した数独の問題
Q(koshix):行1: L _ 5 | _ M _ | 2 _ N行2: _ A _ | 8 B 9 | _ C _行3: 3 _ _ | _ 7 _ | _ _ 8行4: _ 3 _ | _ 4 _ | _ 5 _行5: P D 1 | 7 E 8 | 9 F R行6: _ 6 _ | _ 2 _ | _ 3 _行7: 2 _ _ | _ 5 _ | _ _ 4行8: _ G _ | 6 H 3 | _ K _行9: S _ 9 | _ T _ | 5 _ Uこれでどうですか。A(ChatGPT o3):コンテキストと前提条件・ご提示いただいた 9 × 9 盤面は通常の数独ルール(行・列・3 × 3 ブロックに 1〜9 が一度ずつ)に従うとみなしました。・空欄と赤いアルファベット(A, B, C … U)は同じ「未確定マス」として扱い、まず数独を一意に解き、最後に各アルファベットが入る数字を読み取りました。・手計算で追うと長くなるため、バックトラック法で全探索を行い 唯一解 を確認しています。解の導出(要約ステップ)1.初期候補設定・与えられた数字を固定し、各空きマスに 1〜9 の候補集合を置く。2.基本論理手筋・行・列・ブロックごとに “唯一候補”・“隠れたシングル” を反復適用。3.行列スキャンとブロック整合・ブロックから行/列へ候補を削減し、再び唯一候補を確定。4.バックトラック(必要最小限)・まだ二つ以上候補が残るマスで仮置き → 矛盾検出 → ロールバック。5.完成・全 81 マスが確定し、矛盾なく盤面が完成。(途中で “X-Wing” など高度な手筋は不要で、基本的な絞り込み+最小限の分岐だけで一意解に到達しました。)完成した盤面行1 8 1 5 | 3 6 4 | 2 7 9行2 4 2 7 | 8 1 9 | 3 6 5行3 3 9 6 | 2 7 5 | 1 4 8------+-------+------行4 7 3 2 | 9 4 6 | 8 5 1行5 5 4 1 | 7 3 8 | 9 2 6行6 9 6 8 | 5 2 1 | 4 3 7------+-------+------行7 2 8 3 | 1 5 7 | 6 9 4行8 1 5 4 | 6 9 3 | 7 8 2行9 6 7 9 | 4 8 2 | 5 1 3アルファベットが示す数字文字 数字 文字 数字A 2 H 9B 1 K 8C 6 L 8D 4 M 6E 3 N 9F 2 P 5G 5 R 6S 6 T 8U 3(同じ数字が複数の文字に入っている箇所は、一つの数字が複数マスに出現するだけでルール上問題ありません。)これで赤いアルファベット A, B, C, D, E, F, G, H, K, L, M, N, P, R, S, T, U に入る数字がすべて確定しました。他にも検算方法や途中の詳細ロジックをご覧になりたい場合はお知らせください。
正解だ。pdfがだめだというので,テキストで入れたのだが,むしろ jpg のような画像ファイルにしたほうがよかったかもしれない。ところで,他の生成AIではどうだろうか。
(1) Gemeni 2.5 Pro (experimental)
自信満々で答えをすぐに出してのだが,間違っている。pdfファイルの問題を勘違いしているのかとtext にして確認したけれど,こんどはこちらの問題が間違っていると主張しだした。
(2) DeepSeekV3
中国語で329秒の長考に入った。結論は(日本語にする余裕を失っている),
由于提供的数独表格结构不清晰,导致无法准确解析各单元格的位置和宫格划分。特别是存在同一列中重复数字(如行3和行4的列1均为3),这违背了数独的基本规则。因此,在现有信息下,无法正确解答红色字母对应的数字。建议核对题目排版或提供更清晰的数独结构。
DeepLによる訳(提供された数独表の構造が不明確なため、マスの位置やパレットの分割を正確に解析することができない。 特に、同じ列に重複した数字があり(例えば、3行目と4行目の列の1が両方とも3)、これは数独の基本ルールに反している。 したがって、赤文字に対応する数字は、入手可能な情報では正解できなかった。 問題レイアウトをチェックするか、より明確な数独の構造を提供することを推奨する。)
pdfファイルを読み誤ったのかもしれない。
(3) Qwen-2.5 Max
短時間でスイスイと解いて,中国語で答えを返してきたが,全く間違っていた。チーン。
0 件のコメント:
コメントを投稿