IME のオンライン機能利用における注意について

日本語などのマルチバイト文字を扱う環境において、IME (Input Method Editor) は切っても切り離せない機能です。最近は、この IME に常時インターネット接続を必要とする、クラウド関連の機能が実装されることが増えてきました。うまく使えば有益な機能ですが、利用における注意点などについて説明します。

クラウド機能の定義は IME 毎に異なりますが、概ね以下の様な機能を指しています。

  1. ユーザ辞書の外部サーバへの保存(辞書同期)
  2. 外部サーバからの変換候補の取得(クラウド変換)

これらの機能は文字入力精度や効率の面から見ると非常に魅力的です。ですが、セキュリティの面から見た場合には注意する点があります。

ユーザ辞書の外部サーバへの保存(辞書同期)

殆どの IME はユーザの入力データを元に自動学習しており、効率的な変換が可能です。これらには自動的に学習した単語や、ユーザが自ら登録した単語等が含まれており、ユーザ辞書と呼ばれています。ユーザ辞書に対するクラウド機能としては、複数端末間での同期が挙げられます。外部のサーバにユーザ辞書を保存して、自分の所有する複数の端末で共有することにより変換の効率化が図れます。辞書の保護の観点から、認証及びユーザによる明示的な機能の有効化が必要になっているIMEもあります。

ユーザ辞書には自動学習によりデータが蓄積されるため、意図していない単語が登録されていることがあります。使い込んだ辞書から閲覧機能やエクスポート機能でデータを取り出してみると、他人に見られたくないような単語が登録されてしまっている場合があります。同様に、入力を省く目的で単語登録を使っているケースも注意が必要です。(例: 自分のクレジットカード番号を「くれじっと1」と単語登録している場合など)

辞書同期機能を使う場合は、これを外部のサーバに保存することになりますので、保護に使われる認証情報の管理には注意を払う必要があります。また、クレジットカード番号など送信されると困る情報を扱う場合は IME を無効化したり、当該情報を辞書登録しないということを心掛けて利用する必要があります。

外部サーバからの変換候補の取得(クラウド変換)

IME は変換に用いる単語情報などの辞書を内蔵しており、システム辞書、標準辞書などと呼ばれています。日常生活で使われる新しい単語は随時増えていきますが、辞書に保存されている単語は変わりませんので、そのままでは変換できない単語が増えていきます。それを補うため、オンラインアップデートとして辞書が更新される場合もありますが、更に進んだ形として、入力したデータを外部サーバに送信して変換候補を取得する機能があります。利点としてアップデートを待たずとも、リアルタイム性の高い変換候補が得られます。また、容量制限により大量の辞書データを持つことが困難なモバイルデバイスにとっても有益な機能です。

こちらはあくまで変換のみなので、ユーザ認証無しで使える IME もあるようです。外部サーバから変換候補を得る仕組みから分かるとおり、入力されたデータは外部に送信されます。以下はクラウド変換をサポートする無料の IME を用いて、送信されるデータを調べた結果です。

クラウド変換をサポートする無料 IME の通信例

それぞれ上より

  • おせ
  • おせわ
  • おせわに
  • おせわにな
  • おせわになっ
  • おせわになって
  • おせわになってお
  • おせわになっており
  • おせわになっておりま
  • おせわになっております
  • おせわになっております (変換確定)

と入力内容が逐一送信されて、最後に確定した内容が送信されます。入力中はクライアントを識別可能な情報は送信されていませんが、確定時には、入力対象のアプリケーション名と、ユーザのセキュリティ識別子(SID)が同時に送信されます。

では、もう少し長い文章の場合はどうでしょうか。

=== 入力した文章 ===

    AAA社BBB様

    いつもお世話になっております。

    先ほどメールで送りました添付ファイルのパスワードですが
    「pw123456789」となります。

    お手数ですが来週までに記入してご返送下さい。

    以上、宜しくお願いいたします。Code language: plaintext (plaintext)

=== 送信されたデータより再構築した文章 (適宜改行挿入) ===

    AAAしゃBBBさま
    いつもおせわになっております。
    さきほどめーるでおくりましたてんぷふぁいるのぱすわーどですが
    「pw123456789」となります。
    おてすうですがらいしゅうまでにきにゅうしてごへんそうください。
    いじょう、よろしくおねがいいたします。Code language: plaintext (plaintext)

入力時の IME の状態(全角/半角)によって、半角文字が全角として送られることもありますが、入力したデータがほぼそのまま送られていることが分かります。なお、IME が無効で半角英数字のみ入力可能な状態では送られませんので、あくまで有効時のみとなります。すべての IME のクラウド変換について調査したわけではありませんが、外部のサーバより変換候補を取得する以上、似た様な作りになっているのではないかと推測されます。

まとめ

以上のようにクラウド変換機能が有効な場合は、たとえローカル端末上に置かれた文章ファイルや表、プレゼンテーションの編集であっても、入力したデータは外部へ送信されます。検索エンジンなどへのキーワード入力とは異なり、仕組みを理解していない利用者が、IME による変換で外部にデータが送信されることを自覚するのは困難です。

多くの IME においては、クラウド関連機能は自ら明示的に有効化する必要があります。入力したデータが送信されることを認識し、自ら有効にするのであれば問題無いでしょう。

しかしながら、一部の無料 IME においてはインストール時の推奨設定で自動的に有効化されます。この IME は、フリーソフトウェアなどにバンドルされてインストールされる場合もあります。インストール時に提示されたオプションなどを理解せずに、そのまま OK ボタンを押して進めてしまうと、IME も一緒にインストールされて、クラウド変換機能が有効になってしまいます。また、メーカ製 PC のプリインストールソフトウェアに含まれていることもあります。こちらはインストール済みなので、出荷時の設定により既に有効になっている場合もあります。どちらの場合も利用者は意図していませんので、そのまま使うと知らずに情報が送られていることになります。

特に、企業などの組織において、IME で取り扱う情報を組織内部にとどめておくべきと判断した場合は、組織内のソフトウェアの利用・管理方針などと照らし合わせた上で

  • ユーザ環境の設定により当該機能を利用しないように徹底する
  • 組織境界に設置されたファイアウォールなどで、当該機能の通信を禁止する

といった、対策の検討をお勧めします。

シェアする