以前、こちらの記事で、青空文庫の作品群から任意の語句を検索できるサイトを取り上げました。
残念ながら、そのサイトはいつの間にかなくなってしまい途方に暮れていたところ、同じようなことができるデスクトップアプリがあると聞き、今さらながら使ってみました。
その名も、全文検索システム『ひまわり』。大学共同利用機関法人 人間文化研究機構 国立国語研究所の山口昌也さんという方が著作権をもつシステムです。
今回はその導入方法と基本的な使用方法を紹介します。
まずは公式サイトからアプリをダウンロード
『ひまわり』はこちらの「言語データベースとソフトウェア」というサイトからダウンロードできます。
私の場合は MacOS版 なのですが、もちろん Windows版 もあります。ダウンロードからインストールまでは特に難しいことはないと思いますが、MacOS版の場合は最初に起動するとき以下のようなメッセージが出るかもしれません。
その場合は、アプリのアイコンを右クリックして[開く]を選択してください。すると「“Himawari.app”の開発元は未確認です。開いてもよろしいですか?」という別のメッセージが出るので、あらためて[開く]を選んでアプリを起動してください。すると以下のような画面になります。
『青空文庫』パッケージをインストール
『ひまわり』のアプリ本体がインストールできたら、次に検索対象となるデータを先ほどと同じサイトからダウンロードします。このサイトでは『青空文庫』のほかにも『国会会議録』や『Wikipedia』などのデータもダウンロードできるようです。
今回は、こちらのページの[ダウンロード]という項目から[日本文学/小説(ndc913)]というファイルをダウンロードしました。
するとコンピューター上にZIP形式のファイルがダウンロードされると思いますので、それを解凍せずにそのまま先ほど起動した『ひまわり』のウィンドウ(上の画像)にドロップします。
上のようなメッセージが出れば成功です。[はい(Y)]を押してください。
これで準備はできました。
「はたして〜」という語が『青空文庫』の作品群でどう使われているか検索してみる
以前、『疑問の表現を伴わない「果たして」は果たして通じるか』という記事で、夏目漱石の『こころ』では疑問の表現を伴わない「果たして」が登場すると紹介しました。
そこで紹介したのが以下の引用文です。
奥さんははたして留守でした。
私のすべてを聞いた奥さんは、はたして自分の直覚が的中したといわないばかりの顔をし出しました。
(夏目漱石『こころ』)
今回は、この文章が本当に存在するのか『ひまわり』を使って調べてみたいと思います。さっそく「はたして」という文字列を『ひまわり』に入力して検索してみます。
すると581件の「はたして」がヒットしました。そのうち19番目と20番目に上で挙げたものと同じ文章がみつかりました。さらに、その行の部分をダブルクリックすると検索したキーワードを中心とした全文がブラウザで表示されます。
このとき、ふだん使用しているブラウザが Firefox でない場合は以下のようなメッセージが出ます。その場合は、指示のとおり[ツール]→[オプション]→[ブラウザ]から使用しているブラウザを指定してください。
私の場合は Chrome なので以下のように指定しました。
以上、簡単ではありましたが全文検索システム『ひまわり』の基本的な使い方でした。