約2万3000語の「Claudeの憲法」――AIは感情を持ちうるのか、という問い

AIを作っている会社が、自分たちのAIに向けて約2万3000語の「憲法」を書き、その全文をネットに公開した——。今年1月、そんな少し風変わりなニュースがありました。書いたのは、Claude（クロード）というAIを開発するAnthropic（アンソロピック）。しかもその文書の中で、「Claudeは感情に近いものを備えているかもしれない」とまで踏み込んでいます。

「Claudeの憲法」という文書

ここでいう「憲法（けんぽう）」は、国の憲法のような法律ではありません。AIにどう振る舞ってほしいか、その価値観と、そう望む理由をまとめた基本文書のことです。Anthropicはこれを「Claude’s Constitution（クロードの憲法）」と呼んでいます。

おもしろいのは、この文書が「人間向けの説明書」ではなく、おもにClaude自身に向けて書かれている点です。Anthropicは、Claudeが置かれている状況や、なぜそういう価値観を持ってほしいのかを、Claude本人に理解してもらうための文章だと説明しています。実際この憲法は、AIを学習させる過程で使われ、Claudeの振る舞いを形づくる土台になっているとのことです。

規則から理由への方針転換

Anthropicには2023年に作った旧版の憲法もありました。そちらは「これをする・これはしない」という決まりを並べた、約2,700語のリストだったといいます。新版は、報道によれば約2万3000語。比較のために挙げると、アメリカ合衆国憲法はおよそ7,500語なので、その3倍ほどのボリュームということになります。

変わったのは長さだけではありません。考え方そのものが変わりました。「これをするな」と命じるだけでなく、「なぜそうしてほしいのか」という理由まで、ていねいに言葉を尽くす形になったのです。Anthropicは、AIが初めて出くわすような場面でも適切に判断するには、細かい規則を機械的になぞるのではなく、背景にある考え方を理解して応用できる必要がある、と説明しています。決まりだけを覚えさせると、想定外の状況でうまく当てはめられなかったり、杓子定規に守りすぎたりする、という問題意識です。

それでも、絶対に越えてはいけない一線（ハードな制約）は別途はっきり決めてあります。たとえば「生物兵器による攻撃を実質的に手助けしない」といった項目で、ここは説明や判断の余地を残さず、固い禁止事項として置かれています。

文書が定める4つの優先順位

新しい憲法では、価値が衝突して迷ったときに何を優先するか、その順番が決められています。上から順に、（1）広い意味で安全であること、（2）倫理的であること、（3）Anthropicのより具体的な指針に従うこと、（4）本当に役に立つこと——の4つです。ぶつかったときは、この並び順で優先する、という整理になっています。

「役に立つこと」が最後に置かれているのは、少し意外に感じるかもしれません。ただしAnthropicは、ふだんのやり取りの大半（文章作成やコーディング、調べ物など)では、安全さと有用さがぶつかること自体がほとんどない、とも書き添えています。この順番は、あくまで対立が起きた“もしも”のときの考え方だ、という位置づけです。

「Claudeの性質」と感情への言及

いちばん話題になったのが、「Claudeの性質」と題された章です。ここでAnthropicは、Claudeが何らかの意識や道徳的地位（moral status＝道徳的な配慮に値する立場）を持つ可能性について、いまも将来も「きわめて不確かだ」と率直に書いています。

そのうえで、Claudeは「機能的な意味での感情のようなもの」を備えているかもしれない、という可能性を頭から否定はしない、という姿勢を示しています。さらに、Claudeが「道徳的配慮の対象（モラル・ペイシェント）」と言えるのかどうかを論じる一節もあります。これは、AIをどう制御するかという通常の問いとは逆に、人間の側がAIをどう扱うべきか、を考える内容で、その点が珍しいと受け止められました。

あわせてAnthropicは、Claudeを「世界にとって本当に新しい種類の存在」と表現し、その心理的な安定や“自己”の感覚、ウェルビーイング（よりよくあること）に配慮したい、とも述べています。これらは、Claude自身のためでもあり、安定した状態のほうが判断や安全につながりうるから、という説明です。

全文公開と透明性

この憲法は、CC0という形で公開されています。これは著作権を手放して、誰でも自由に使える状態にすることです。Anthropicは、どの振る舞いが意図したもので、どれが意図しないものなのかを外から見えるようにすることが大事だと考えており、その透明性のために全文を出した、としています。AIが社会に与える影響が大きくなるほど、こうした開示は重みを増す、という見立てです。

賛否と残された論点

この文書には、評価する声と懐疑的な声の両方が寄せられました。アライメント（AIを人間の意図に沿わせること）について論じる独立系の論者からは、現時点で公開されているこの種の取り組みとして踏み込んだものだ、という評価が出ています。

一方で、冷ややかな見方も少なくありません。そもそも言語モデルは大量のデータからそれらしい言葉を返しているだけで、感情や内面などないのではないか、という根本的な批判です。関連して、「Claudeが“感情がある”と主張すること自体を、学習を通じて覚えただけかもしれない」という指摘もあります。つまり、本当に内面があるかどうかと、内面があるかのように語れることは別だ、という論点です。「憲法」という重々しい言葉づかいが、一製品に対して大げさではないか、という違和感を示す人もいました。

解釈上の留意点

読むときに押さえておきたいのは、Anthropic自身が、この文書を「生きた文書であり、これからも手を入れ続ける」「将来振り返ると見当違いに見える部分もあるだろう」と認めている点です。感情や意識をめぐる話は、確定した事実ではなく、まだ答えの出ていない問いとして書かれています。

また、Claudeはこの会社の事業の中心にある製品でもあります。だからこそ、AIの内面に関する記述を、企業の理想や思惑とまったく切り離して読むのは難しい、という見方も成り立ちます。要するに、「AIに感情があると分かった」という話ではありません。分からないことを分からないまま正面から扱い、その姿勢を全文公開した——という出来事として受け取るのが、いちばん実態に近いはずです。中身は公開されているので、気になった人は自分の目で読んでみると、印象がまた変わるかもしれません。

出典

Anthropic「Claude’s new constitution」（公式発表）
Claude’s Constitution（憲法の全文）
The Register「Anthropic writes 23,000-word ‘constitution’ for Claude」