“オープンソース”は,情報工学では,インターネット等を介して入手し,利用できるソフトウェア(OSS : Open Source Software)を指す.これに対し,社会学等の分野では,(有償か無償かにかかわらず)一般に入手することができる情報を指し,外交政策立案には,機密情報よりオープンソースが重要だとされる[1].一方,中国は一党独裁の政権国家であり,すべての情報が政府の統制下に置かれている.そのため,対中国に関する外交政策の立案には,幅広くオープンソースを収集しても同一の内容しか把握できないと考えられてきた.このような状況を受け,インターネット上のSNSを代表とするビッグデータが実際の対中政策立案に用いられたことは,ほとんどない.翻って,2012年の中国各都市で発生した対日運動発生時は,多くの日本国民が,日本政府がとる対中政策のタイミング悪さに苛立ちを覚えた.我々は,最近の中国内のインターネット上の一般市民による発言数の急増から,専門家とは異なる見解を持った.つまりインターネット上の一般市民の情報発信の動きは,中国共産党に完璧に統制されている報道とは,必ずしも一致はしていない可能性があるという推察である.そして,もしこの推察が事実であるなら,これらを,日本から中国に提示する政策の内容や提示タイミングに利用できるのではないかと考えた.これを確認するために,中国が発信元であるオープンソース・ビッグデータ内の日本に関する発信数を日ごとに追った折れ線グラフ(Chinese PULSE)として出力させ,対中政策の専門家らによる評価を行った.

1.はじめに

 本研究は,近年悪化を続ける日中関係の政策立案へのビッグデータの活用の可能性発見を目指す.2012年9月,日本政府が尖閣諸島の国有化に踏み切ったことで,日中関係は国交正常化以来最悪の状態になったと日中双方の政府当局者が認めている.外交の現場では,交渉の“札”に相手国がどう応じるかを予測しながら,実際に提示するかどうかや,提示のタイミングを検討する.この予測のよりどころとなるのが,相手国に関する多くの情報であり,これらは,公式・非公式,また公開・非公開の区別なく,さらに発信者が国家であるものから,国民レベルまで広範囲から収集される.外交政策分野では,これらの中で,特に意思決定に資する材料を「インテリジェンス」と称している.一般には,外交政策のインテリジェンス獲得方法として諜報活動が想起されるが,実際は誰もが(有償か無償かは関係なく)入手できる情報を利用する[1].そして,外交の分野では,これら,誰もが入手できる情報を「オープンソース」と呼んでいる.一方,中国は共産党による一党独裁体制であるため,オープンソースでさえ当局の検閲と規制の下に置かれている.そして,入手できる情報のほぼすべてに同様の意見や見解が示されているといわれ,さらに,発信件数さえも操作されていると知られている.したがって,日本の多くの専門家は,オープンソースをくまなく収集し利用しても,外交政策の意思決定に大きな変化は及ぼさないと考えている.このため,対中政策の研究や実務には,代表的な新聞等が発信するものが利用されてきた.その一方で,一般市民の発信情報やさらにビッグデータに相当するインターネット上の大量の情報を使った事例報告は存在していない.

 このような状況において,我々は,報道各局が発表した情報と,一般市民が発信する情報の両方を利用することで,これまでとは異なる政策立案が可能になると考えた.これまでに当該分野の実務家が,この可能性を検証した例はほとんど見つけることができない.そこで今回は,次のようなアプローチで可能性を検証した.ビッグデータに対する高度な分析処理は行わず,中国国内が発信元であるオープンソース・ビッグデータの日本に関する発信数の時間的変動の可視化である.より具体的には,日本に関する発信数を日ごとに追った折れ線グラフで出力させることにした.このとき,中国共産党の完璧な管理と統制下に置かれている報道各局による発信数の推移と,一般市民の発信数のそれを別々に出力させた.一般市民による情報発信数を示す折れ線グラフと,報道各局発表のそれとが異なることを確認できれば,オープンソース・ビッグデータを,外交政策の現場で利用することの価値を示せるのではないかと考えた.

 そしてさらに,外交の専門家らによる実践利用の観点で,出力結果の評価を行った.

 本稿は次の構成をとる.第2章にオープンソース・ビッグデータの外交政策立案への活用に関する先行研究を示し,第3章にこれまで日本国内で認知されている日中関係と,中国国内の内政事情,特に情報統制に関して振り返る.第4章に,我々の主張に基づいて開発したシステムと,それが出力したChinese PULSEを示し,第5章に外交専門家らによる出力結果の評価と課題を述べる.第6章と第7章に,それぞれ,考察とまとめを整理する.

 本稿では,本章の冒頭に述べた社会学の慣例に従い,“オープンソース・データ”は有償か無償かに依存せず,一般に入手できる情報を指す.そして,総務省が示す「ビッグデータとは(中略)多量性,多種性,リアルタイム性」を備えた電子コンテンツ[2]に準じる.したがって,本書で述べる“オープンソース・ビッグデータ”は,“オープンソース・データ”の中で,特にインターネット上に発信されたものを指すものとする.