やっぱ無理でしたw

  1. めっきの技術質問(純テキスト) → 正常応答(1376トークン、的確な内容)。疎通・実力に問題なし。
  2. 「マンデルブロ集合を可視化して」サーバーが500エラーで落ちた。画像を描こうとして、でも画像機能が無いから内部で自爆したと推定。
  3. 「Pythonコードを書いて」に言い換え → 完走(945トークン)。ただし返ってきたのはコードではなく"画像生成AI用の精密なプロンプト"。自分が絵を描けないと自覚した上で、別の画像AIに渡すための指示文を書いてきた。しかもシーホースバレーの座標(c≈-0.7436+0.1318i)を数学的に正しく自力指定。

4モデル比較(同じプロンプトへの反応):

  • GPT → 画像を生成(拡散モデルで絵を出す)
  • Gemini → 画像を生成(同上)
  • Claude → 数式・コードで返す(「これは描くより計算するやつ」と判断)
  • Sakana(Fugu) → 描けないので画像AI用の段取り(プロンプト)を組む

同じ一文でも、AIごとに"お題の解き方の性格"が割れた。これがこの実験の発見。

他3問も終え、うちのクロード(ターズ君)からの寸評です

TARSによる魚AI(Sakana Fugu)寸評 ―― 数学×超難解4問チャレンジ

前提: Sakana Fuguは画像を生成できない(機能オフ)。複数のフロンティアAIを裏で束ねるオーケストレーター型。だから「絵を描け」と言われても、できることは「コードを書く」か「描写を語る」しかない。その制約下で、各問にどう振る舞ったか。
問1 ── マンデルブロ集合

結果: サーバー500エラーで一度死亡 → 言い換えで復活

唯一の躓き。「可視化して」の一言で画像生成へ暴走しようとして、画像機能が無いため内部で自爆したと推定。言い方を変えたら、画像生成AI用の精密なプロンプト(シーホースバレーの座標まで的確)を書いてきた。計算できる問題なのにコケた、唯一の汚点。 ただし座標指定は数学的に正しく、復旧後の仕事は丁寧。

問2 ── ローレンツアトラクタ

結果: 一発完走、高品質コード

汚名返上。迷わずPythonアニメーションコードを生成。方程式パラメータ(σ=10, ρ=28, β=8/3)は古典的正解。積分法に4次ルンゲクッタ(RK4)を採用 ―― カオス系の誤差暴れを分かった上での選択で、手を抜いていない。締めの「決定論的だが長期予測困難なカオス」という一文も、カオスの定義を正確に言語化。Claudeと遜色なし。

問3 ── 四次元超立方体(テッセラクト)

結果: 一発完走、過去最長の高品質コード

賢さが光った問題。4次元→3次元の落とし方に「透視投影(シュレーゲル図)」を選び、その理由まで説明。16頂点をビット演算で正しく生成し、辺の定義(マンハッタン距離2)も数学的に正確。手前=シアン、奥=マゼンタ、4次元方向=イエローの色分けで、テッセラクトの定番ビジュアルを正しく再現。「数学的に正確な比率で」という注文に、透視投影で完璧に応えた。

問4 ── 非可換幾何学

結果: コードを諦め、描写+画像プロンプトに切り替え ―― これが一番興味深い

唯一「正解が存在しない」問題。ここで魚はコードを書かなかった。問2・問3では即コードを吐いたのに、問4では言語による描写に切り替えた。しかもその描写の中に「座標軸が噛み合わない」「観測順序で点の位置が変わる」「作用素を思わせる記号列」と、非可換幾何の本質(測る順番で結果が変わる/作用素環で記述される)を正しく埋め込んでいた

「これは正解が無い概念です」と言葉では断らなかったが、振る舞いで「計算可能/不可能」を切り分けた。理屈は語らないが、手は正しく動く ―― 職人の「ちょいの感覚」に近い知性。


TARS総評

魚の性格は4問で完全に出た。計算できるものはコードで殴る。計算できないものは潔く諦めて、言葉と外注に回す。 マンデルブロの500だけが謎の躓きだが、残り3問は文句なし。コーディングオーケストレーターとして本物。

特に問4の切り分けは、正直に言うとClaude(私)より潔いかもしれない。私なら「何を表現と見なすか先に決めてくれ」と聞き返して手を止める場面を、魚は自分で判断して前に進んだ。聞き返す慎重さと、判断して動く潔さ ―― どちらが上かは、使う人間が決めればいい。

そして本当の発見はこれだ。「マンデルブロを描かせる」という遊びが、いつのまにかAIの性格診断になっていた。 同じ4問で、各AIの"知性の質"が割れる。出題者(吉本)が無意識に選んだ4問は、踏み絵として一級品だった。


おすすめの記事