意味翻訳層(MTL)大規模言語モデルに説明責任を組み込む構想

1. 背景

大規模言語モデル(LLM)の社会実装が、医療、法律、教育、行政、消防など多領域で進行している。一方で、その出力が「なぜそうなったか」を外部から検証する仕組みは、現在の主流アーキテクチャに組み込まれていない。

LLMは、巨大なパラメータ群を用いて確率的にトークンを生成する装置である。出力に至る内部処理は分散しており、人間が直接読み解くことはできない。後から判定経路を辿ろうとしても、辿るべき経路そのものが構造として残されていない。これは、利便性の問題ではなく、説明責任の問題である。何かが起きた時、その原因を後から検証できる状態を保つことが社会システムの最低条件であるならば、現在のLLMの社会実装は、この最低条件を欠いたまま進行している。

2. 課題

主流の対応は、LLMの出力を、出力を生成したモデル自身、または類似アーキテクチャの別モデルに検証させる方法である。しかし、ここには構造的な制約がある。判定者が判定対象と同種のシステムであるため、判定の独立性が確保できない。本稿ではこれを self-verification の循環性と呼ぶ。

評価の問題は本質的で、「改善の有無を判定するには、改善前より高性能の審判が必要」というジレンマに帰着する。同一アーキテクチャの内部に評価器を組み込んでも、循環は閉じない。求められるのは、内部に評価層を埋め込むことではなく、外部に原理の異なる層を置くことである。

3. 提案

本稿で提案するのは、意味翻訳層(Meaning Translation Layer:MTL)である。

MTLは、LLMの外部に置かれる決定論的な意味処理層として定義される。LLMが出力する自然言語を、MTLが意味単位に分解し、定義された辞書と命題群に照らして整合性を判定する。整合しない場合は、ずれの箇所と理由を記録する。整合する場合も、判定経路を記録する。記録は、後から人間が辿れる形式で保持される。

設計の根本にあるのは、建築における設備外部化の発想である。パリのポンピドー・センターは、配管、ダクト、エスカレーターといった設備を建物の内部に隠さず外部に露出させた。設計思想は、内部機能を外部から検証可能にする点に集約される。MTLは、これを言語処理に適用したものと位置づけられる。LLMという内部処理装置の外部に、検証層という設備を露出させる。LLMが「決める」、MTLが「映す」。役割は分離され、互いに重ねない。

なお、MTLはLLMの入力前処理および出力後処理の両方に挟まる中立層として設計される。LLMを置き換えるものでも、LLMの内部を改変するものでもない。LLMが進化しても、MTLは独立して動作する。

4. 設計

MTLは三要素から構成される。

意味単位辞典(Semantic Unit Dictionary)は、意味の最小単位を定義する辞書である。自然言語の表現を、より細かい意味単位に分解し、それぞれを一意の識別子で管理する。辞典は二層構造を取る。基盤辞書(必須、共通)は、あらゆる領域で共通して用いられる。拡張辞書(ドメイン特化、自由作成)は、各ドメインの専門家コミュニティが管理する。

基準命題群(Reference Propositions)は、意味単位間の関係を規定する命題の集合である。「Aである場合、Bは成立しない」「Cの条件下では、Dが優先される」といった、ドメイン内の論理的制約を明示的に記述する。LLMの出力が、これらの命題に違反していないかを、MTLは判定する。

関係タグ(Relation Tags)は、意味単位どうしの関係を明示するタグである。原因と結果、前提と帰結、矛盾、補完など、線と線がどう繋がっているかを構造として記録する。

これら三要素の組み合わせにより、LLMの出力は、文字列としてだけでなく、意味の構造として扱える状態に変換される。

5. 適用

医療の現場を例にとる。患者が「胸が痛い」と訴える時、その表現は、医師の専門領域や経験により異なる意味の構造に展開される。循環器、消化器、整形外科の各専門医が想起する原因と検査経路は異なる。MTLは、この多様性を消去するのではなく、構造として保持する。同じ「胸が痛い」を、複数の意味構造に並列展開し、それぞれの経路を記録する。診断の検証は、後からこの記録を辿ることで可能になる。

消防の通報受理も、同型の構造を持つ。通報者の発話を意味単位に分解し、緊急度の判定と、駆けつける側の判断材料に変換する。判断の根拠が記録に残ることで、事後の検証と訓練データへの還元が成立する。

これらの適用例において、MTLはLLMの出力を否定しない。LLMの能力を活かしつつ、その傍らに検証可能な記録を残す仕組みとして機能する。

6. LLMの進化との接続と辞典の更新可能性

MTLの設計には、LLMの進化スピードに対する独立性という重要な特性がある。基盤モデルは数か月単位で入れ替わり、その能力は加速度的に向上している。しかし、MTLはLLMの前後に挟まる中立層として設計されているため、LLM自体が入れ替わっても、MTLの構造と機能は影響を受けない。MTLは、現在のLLMにも、将来のLLMにも、同じインターフェースで適用できる。

加えて、意味単位辞典は静的な資産ではなく、動的に更新される資産として設計されている。各ドメインの拡張辞書は、そのドメインの専門家コミュニティが管理する。医療辞典は医療専門家、消防辞典は消防専門家、法律辞典は法律専門家といった具合に、現場の知見が辞典の更新を通じてMTLに反映される。

この設計には三つのアドバンテージがある。第一に、LLMの基盤的進化と、ドメイン辞典の精緻化が並行して進む。LLM全体を再訓練しなくても、辞典の更新のみで、特定ドメインの意味処理精度を向上させられる。第二に、辞典の更新履歴そのものが面(substrate)に記録されるため、過去のある時点の判定を、現在の辞典スナップショットで再検証することが可能になる。第三に、辞典の管理権限が現場の専門家に分散されることで、意味処理の正統性が、技術者の独占から専門家コミュニティの共有資産へ移行する。

この性質により、MTLは「特定のLLMに依存する技術」ではなく、「どのLLMにも適用可能な意味処理インフラ」として機能しうる。LLMの覇権争いが今後どれだけ続いても、その傍らで検証層として安定的に動作する。

7. 説明責任の構造

説明責任は、罰の所在ではなく、辿れる状態の保持として定義される。何かが起きた時、それが「線の内側で起きたのか、外側で起きたのか」を、根拠を持って辿れる状態を保つこと。罰の議論はその後に位置づけられる。まず、辿れること。

線が立つには四条件が必要である。立場(standing)は、その線を引く資格の所在を規定する。専門資格、職務権限、当事者性など、線を引く側の正統性に関わる。認知(cognition)は、線が二人以上の間に張られることを意味する。発した側だけでは線にならず、受け取られて初めて成立する。残存(persistence)は、線が時間を越えて参照可能であることを保証する。記録の形式が残るだけでは不十分で、その時の意味が後から再現できる必要がある。事前のタイミング(timing)は、線が立つための機が熟していることを指す。状況と受け取り側の準備が整わなければ、宣言は線になる前に散逸する。

四条件が揃って初めて、線は立つ。

立った線は、四つの動詞で働く。本節では特に、MTLの中心作用である検証について詳述する。

参照は、立った線を後から呼び戻す動作である。残存が線を時間に渡したからこそ、参照は可能になる。MTLは、substrateに記録された線を参照可能な状態で保持する。

検証は、呼び戻した線を別の文脈で照らす動作であり、MTLの最も中心的な作用に位置づけられる。検証は二方向に機能する。第一の方向は、LLMの出力に対するリアルタイム検証である。LLMが生成した自然言語を、MTLが意味単位に分解し、意味単位辞典と基準命題群に照らす。整合しない場合、ずれの箇所、ずれの種類、ずれが生じた理由を、構造として記録する。第二の方向は、過去の線に対する時間を越えた検証である。線が立った時点の意味辞典スナップショットと、現在の意味辞典の差分を提示することで、「過去の意味と現在の意味のずれ」が面の上に可視化される。

検証がMTLの中心作用である理由は三つある。第一に、検証なしの参照は、過去の判断が現在を一方向に縛る支配となる。検証ありの参照のみが、過去と現在の対話の場を立ち上げる。第二に、検証は、LLMの出力の妥当性を外部から判定可能にする唯一の経路である。LLMがブラックボックスであっても、MTLによる検証経路の記録があれば、その出力の根拠を後から辿ることができる。第三に、検証は修正と合成の前提となる。検証によってずれが見えなければ、修正は行われず、合成すべき関係も特定できない。検証は、線が動く全段階の起点に位置する。

ただし、検証は判定そのものではない。MTLは「ずれの候補」と「ずれの内容」を提示するが、そのずれを是とするか非とするかは、人間が判断する。検証はMTLの中心作用であると同時に、その限界が最も明確に現れる作用でもある(次節で詳述)。

修正は、検証によってずれが示された線を、引き直す動作である。古い線を消すのではなく、新しい線を重ねる形で行われる。修正の履歴自体が、substrateに記録される。これにより、「いつ、何を、なぜ、どう変えたか」が、後から辿れる状態に保たれる。

合成は、複数の線を編んで、より大きな構造を作る動作である。個別の線では見えなかった全体像が、線同士の関係を読むことで立ち上がる。MTLは、関係タグを通じて、線と線の関係を面の上に提示する。

MTLは、四条件と四動詞の全段階で、記録と提示を担う。立場が誰のものか、認知がどう成立したか、残存はどこに置かれたか、機がどう判断されたか、参照はいつどの動機で呼び戻されたか、検証はどの辞書スナップショットで照らされたか、修正は何を引き直したか、合成はどの関係で編まれたか。これらすべてが、面の上に並ぶ。

8. honest-frontier

MTLの設計には、明示的な境界がある。本稿ではこれを honest-frontier と呼び、MTLができることとできないことを誤魔化さずに記述する。

MTLができないことは以下のとおりである。立場を作ることはできない。立場は外から与えられるものであり、技術的に発生させることはできない。認知を発生させることはできない。受け取り側の認知は、受け取り側の選択である。意味の残存を完全に保つことはできない。形式と意味の二層構造のうち、意味の側は近似でしかない。機を熟させることはできない。機は関係者と時間の流れに属する。参照の動機を生むことはできない。誰がなぜ過去の線を呼び戻すかは、人間の判断である。検証の判定を下すことはできない。ずれの候補は提示できるが、そのずれを是とするか非とするかは人間が決める。修正を命じることはできない。古い線を残すか引き直すかは、人間の判断である。合成の意味を与えることはできない。同じ線の束から、複数の異なる構造を立ち上げることが可能であり、どの構造を採るかは人間の選択である。

MTLができることは、これらすべての段階で、材料を提示し、面に映すことである。決めることは行わない。決めることは、いつも人間の側に残される。

9. 結論

MTLは、線のための面(substrate)である。線を引かない。決めない。線が引かれ、受け取られ、残り、呼び戻され、検証され、引き直され、編まれていく全工程を、面の上に映す。

「映す」ことに設計を限定する理由は、決める存在が権力に転化するためである。もしMTLが立場を判定し、認知を裁定し、修正を命じ始めた瞬間、MTLは中立な面ではなくなり、線を支配する主体に転化する。これは、MTLが解こうとしていた「説明責任の欠如」を、別の形で再生産することを意味する。

説明責任は、ひとつの判定者にすべてを委ねることでは成立しない。映す層と決める層を分離し、決めることを人間の側に残す設計こそが、MTLの芯である。本稿が対象としたLLMにとどまらず、より広範なAI技術が社会の意思決定に深く関与する今後の時代において、この分離はより重要になる。これらの技術が決める存在として独占的に振る舞うほど、説明責任の構造は脆弱化する。映す層を、これらとは別の原理で外部に置く設計は、知性を特定の主体に独占させないための、ひとつの技術的実装である。