大宅壮一文庫は人力データベース

元祖SHINSHINさん
元祖SHINSHINさん
立花隆がロッキードものを書いたとき、
足繁く通っていたのが「大宅壮一文庫」なのだという。

この「大宅壮一文庫」は特に雑誌を中心に記事を集めた、
縦横無尽な検索性のある人力データベースだという。

検索分類が特殊なので馴れるまで時間がかかるが、
一度その傾向がわかると、大変に便利なのだという。
その集められた記事数は、なんと20万件に及んだという。

★「日本ノンフィクション史 
    ~ルポルタージュからアカデミック・ジャーナリズムまで~」
  武田徹著 中公新書 2017.3.25.発行

しかしながらこれは人力なのであるから、
恐らく現在のような電子データベース的な検索は難しい。
(電子化されていれば別だが)

また、たとえ電子化されていたとしても、
その内容をどのようにフィールド分けし、保存しているかによって、
検索の仕方が変わってくる。

さらに、データベースソフトの仕様により、
効率性も変わってくると思われる。

    *

特に最後の段、
オイラはマイクロソフトのことしか知らないし、
またデータベースソフトはパーソナルなACCESSしか知らない。

けれども、このACCESSのフィールドデータ型には、
「メモ型」というのがある。

これは通常の定型的なデータ型と異なり、
入力したデータの大きさによって自在に伸縮してくれるという便利な型だ。
定型的なデータ型の場合には、最大で何文字まで入力できるようにするか、
あらかじめ考えなくてはならないので、面倒な場合がある。

現在、仕事に利用していた薬品データベースを復旧しがてら、
この「メモ型」を利用して、特に薬の相互作用と重大な副作用を、
電子添付文書からコピー・改変してデータベースを編んでいる最中だ。

実際にこの「メモ型」がどの程度、データ容量的に耐えられるのか、
実験しているとも言える。

    *

通常、広くあまねく世界で利用されている大容量・高速データベースだと、
このような「メモ型」などという流暢なデータ型を用いることは、
ほとんど有り得ないだろう。
パフォーマンスが落ちるだろうことは、容易に推測できるからだ。

しかし、ここではパフォーマンスを求めるのではなく、
記憶・学習用途に用いることを第一義とした場合、
この「メモ型」こそが長所を発揮すると推察される。

もしも、オイラが「大宅壮一文庫」を電子データベース化するならば、
恐らくは「メモ型」が存在するであろうSQLサーバーを利用して構築するだろう。

    *

この「メモ型」で項目を記憶させて、検索はどうするかというと、
「曖昧検索」という機能が存在するので、それを利用する。
ACCESSでは、検索したい言葉をアスタリスクではさむとそれが実現される。

あとは、その検索結果を帳票にしたり電子データで閲覧するというスタイル。

    *

データベースを利用して、記憶・学習するのには、
この「メモ型」を利用するのが便利だ。

薬剤関係のみならず、法律関係や日本史・世界史、
場合によっては語学・辞書などにも、工夫するといろいろ応用できると思われる。

「記憶の宮殿」方式を組み合わせると、
それは予習よりは主に復習用途に大きく力を発揮するだろう。

転じて、大宅壮一がまさに実行したように、
文筆家ならば、ネタ帳にも応用できるし、
あるいは、「書きたいところから書くスタイル」をとるという百田尚樹などの場合には、
下書き的にページ的な分類番号を振って、
この「メモ型」フィールドに文章を書いてしまえばいい。

辞書の場合には、
これはどなたかの先生(稲荷な言語学者かもしれない)の書籍にあったのだが、
意味が生じた起源順だとか、よく使われている順だとか、
他にももうひとつあったのだが、
それらの要素によって実際に辞書が系統づけられるという。

それを考慮した電子型データベース辞書ならば、
ユーザーの気分によって、いかようにも並べ替えが可能と思われる。

    *

つまり、テキストとしてデータを丸ごと保存するのと、
テキストをあらかじめ何らかの意味・意義によって
フィールドに分けタグ付けして保存するのとで、
応用力が変わってくる。

具体的にわかりづらいだろうか?

恐らく、データベースを利用した帳票を作成してみると、
オイラの言っていることが、あっさり理解できると思う。

また、これがわからないと、
表計算ソフトとデータベースソフトの違いも理解できない。
続いて、データマイニングもどうしてそうできるのか、原理がわからない。
企業のソフトウェア・ハードウェアの運用も理解できない。


PS:現在、ITプロの連中の間でも、
   テキストデータ(表計算ソフト)とデータベースとの運用に絡む事柄で
   紛糾しているらしい。「Excel方眼紙」問題と言っている。
   某役所では、IT契約の打ち切りだとかで揉めているらしい。
   なので、これは重要なツボなのだ。

















元祖SHINSHINさんのブログ一覧