2025年8月10日日曜日

GPT-5(2)

GPT-5(1)からの続き

なぜか小数の計算があいかわらず苦手だと聞きつけて試してみた。明日もう一度確認してみることを忘れないように。

Q(koshix):
解いてください。 5.9=x+5.11

A(ChatGPT-5):
方程式 5.9=x+5.11 を解くと、
x=5.9−5.11
x=−0.21
答え: x=−0.21 です。

Q(koshix):
5.9-5.11を計算してください
A(ChatGPT-5):
5.9 − 5.11 を計算すると
5.90−5.11=0.79−1=−0.21
答え: -0.21 です。

Q(koshix):
5.9-5.11を計算してください。
A(ChatGPT-5 Thinking  13s):
5.9−5.11 は、小数点をそろえて
5.90−5.11=0.79 です。答え:0.79
※ 先ほどの方程式 
5.9=x+5.11 の解も 
x=0.79 に訂正します。誤りがあり失礼しました。

Q(koshix):
あなたが簡単な小数の計算をよく間違えるのはなぜでしょうか。
A(ChatGPT-5):
ご指摘のとおり、私が小数の暗算でミスることがあります。理由は主に次の通りです。
1) 生成モデルの性質
私はまず「計算器」ではなく「文章生成器」なので、厳密な演算エンジンではなく確率的な文章予測で答えを作ります。計算手順を自分で書いて検算しないと、符号の取り違えや借り算の見落としなど“ヒューマン的”ミスを起こし得ます。

2) 桁・符号の取り違えが起きやすい局面
・小数点以下の桁数が異なる(5.9 と 5.11 など)
・方程式を移項してから差を取るとき(x=a−b の符号を反転してしまう 等)

今後の対策(こちらで徹底します)
・小数点をそろえて桁ごとに筆算(例:5.90−5.11)。
・妥当性チェック(概算:5.9−5.1≈0.8 なので答えは約0.8のはず)。
・逆演算で検算(差に 5.11 を足して 5.90 に戻るか)。
・ご希望なら毎回計算ツールで最終確認も行います。

たとえば今回:
5.90−5.11=0.79、検算で 
0.79+5.11=5.90 ― OK です。
以後は上の手順で必ず二重チェックします。
必要なら「常に計算ツールで検証」モードにしますが、どうしましょう?

Q(koshix):
「常に計算ツールで検証」モードにするというのはどういう意味ですか?
A(ChatGPT-5):
ここでいう「常に計算ツールで検証」モードというのは、
私が小数や分数など数値計算を含む質問に答えるとき、文章だけで暗算せず、必ず内部の計算エンジン(Pythonなど)で計算を実行して、その結果を提示するという運用のことです。
通常モード(今まで)
・文章生成モデルとして、暗算や筆算手順を文中で行い、答えを生成。
・必要に応じて検算はするが、計算ツールは必ずしも使わない。
・このため、単純計算でも桁や符号の取り違えによるヒューマンライクなミスが発生する可能性がある。
「計算ツール検証」モード
・質問に数値計算が含まれる場合、まず内部で計算ツールを使って正確な値を出す。
・その結果をもとに説明や解説を書く。
・実質的に「関数電卓を使って答えを出す」イメージなので、小数や大きな数の計算ミスはほぼゼロになる。
・時間はわずかにかかるが、確実に正しい数値が返せる。

もしご希望であれば、これ以降 すべての数値計算を計算ツールで検証してから回答するようにします。たとえば「5.9 - 5.11」も、すぐに Python に投げて、正確に 0.79 と出して提示します。このモードに切り替えますか?


Q(koshix):
それは,今後の私の新しいチャットにおいて常に適用されることになるのでしょうか?
A(ChatGPT-5):
いいえ、そのままだと今後の新しいチャットに自動で適用されるわけではありません。理由は、私が「常に計算ツールで検証」モードを使うかどうかは、現在の会話セッションの中での方針としては保持できますが、新しいチャットを開いたときにはリセットされるためです。

もし新しいチャットでも常時適用したい場合
あなたの**メモリ(記憶機能)**に「数値計算は必ず計算ツールで検証してから回答する」という方針を保存する必要があります。
そうすると、どの会話でも最初からそのルールで対応します。

ご希望であれば、
「ユーザーは今後のすべての会話で、数値計算は必ず計算ツールで検証してから回答することを希望している」という情報を私の記憶に追加できます
これ、保存して常時適用しますか?

Q(koshix):
はい保存して常時適用してください。
A(ChatGPT-5):
保存しました。
これからは、新しいチャットでも数値計算は必ず計算ツールで検証してから回答します。
P. S. 次の日,同じような計算をしたところ,pythonを使って答えを出してきた。

0 件のコメント: