「知のマッチング機能」とは何か
千葉市長は「知のマッチング機能」について個人情報は必要ないとしたうえで、これを「含めることでリスクを上げる必要はない」と述べている。*1
千葉市長の考える「知のマッチング機能」はこういうものだという。
* 「このテーマではこうした本も借りられている」ということが分かり*2
* 類似のテーマで司書が過去にレファレンス対応したものも分かり*2
* しかしAmazonのレコメンドのような購買履歴は想定せず*3
* あくまである本を借りる場合の関連書籍の紹介などを想定*3
ある本とある本が同時に借りられやすい、または連続した貸出のタイミングになりやすいといった情報を蓄積した上で、同じ本を借りようとする人に対し、過去の傾向を提示するような方式だと思われる。
読書履歴からのおすすめはしないとしても、多くの人の読書履歴を蓄積しないことには意味のあるマッチングの提示はできないだろう。
一方、例えば成田市の「おすすめリスト」(2009年当時)はこのような機能になっている。
- 蔵書を貸出総回数、総予約数、 図書館評価、利用者評価、キーワード出現回数等を元に点数化する
- 利用者の貸出中/予約中/「今度読みたい本」から著者名、件名、分類等を抽出
- 得られたキーワードで蔵書を検索し、点数の高い順に「おすすめ」する
- 履歴保存を希望する利用者に対しては、履歴からもキーワードを抽出して検索する
成田市は利用者が希望すれば読書履歴を図書館システムに記憶させることができる。
読書履歴は利用者個人に対する「おすすめリスト」作成にのみ利用される。
図書館が「おすすめ」する根拠は貸出冊数や図書館・利用者の評価等、既存の情報であり、他者の個人情報は使われない。さらにこのリスト作成はいつでもやめることができ、履歴はそのときに削除される。
成田市の仕組みは個人情報を図書館が保持するものの、全体の処理には用いないため、「おすすめリスト」利用の多寡に関わらず常に同じ結果を出すことができる。一方千葉市長の考える「知のマッチング機能」は本人同意を得た利用者の読書履歴が相当数蓄積されないと、マッチングを開始することすらできない。
例えば同意者が2人しかいない場合を考える。
名前 | 貸出1 | 貸出2 | 貸出3 |
---|---|---|---|
Aさん | 羊をめぐる冒険 | ダンス・ダンス・ダンス | ノルウェイの森 |
Bさん | 入門Perl | 入門Ruby | 入門Python |
これらが貸出履歴のすべてだとすると、次に誰かが「羊をめぐる冒険」を借りると「ダンス・ダンス・ダンス」と「ノルウェイの森」が「マッチング」されることになってしまい、Aさんの履歴がそのまま「ある本を借りた人がこの本も借りている」になってしまう。もちろん千葉市長はこういったことも踏まえて「人口100人未満の村図書館とかの特殊事例は除きます」*4と述べているが、これは自治体規模の問題ではなく、同意者の数であることに注意が必要だ。千葉市長の表現で言い換えるなら、同意者100人未満の特殊事例を除くということになるだろう。しかし本当に100人で良いのかは確認が必要だろう。
千葉市は人口およそ100万人で、14%の市民が図書館を利用しているそうだから、14万人の図書館利用者がいることになる。この14万人が年間で523万冊を借りるという。*5 このうち一体何人が貸出履歴の蓄積に同意すると、有効な「知のマッチング」ができるようになるだろうか。
もっとも、千葉市は人口が多く、*6 自治体のなかでは「ビッグ」な部類に入るだろう。しかしこれよりももっと小さな規模の自治体はたくさんあって、そこに住まう人たちも多い。そうした人たちも含めて「知のマッチング」の恩恵を受けるにはどうしたらよいか。
こういう仕組みで行くと、「個人情報とサービスの分離ができる」「利用者がサービスを自由に選ぶ事ができる」「図書館をまたいだ利用ができる」「(利用者を集められれば)リコメンドサービスの提供がしやすくなる」「SNSとの親和性が高い」というメリットがありそうです。
もちろん、「利用しない自由」は完全に保証されますし、図書館が貸出履歴を保存しているのではないかと言う懸念をもたらす心配もなくなるでしょう。図書館関係者の方には、こういう枠組みを作って、サービスの発展を促したり、構築に参加していくような活動を期待したいなと思います。
自前主義というのも役所の良くない点として言われるところだろう。
自前でマッチングするのではなく、利用者の履歴は利用者が自由に使えるようにすればよく、その情報を利用者自身が別のサービスへ預けることでマッチングなりレコメンドなりされれば良いのだと思う。既に「読書通帳」などの仕組みも存在しており、利用者が自身の履歴を自分で管理することは可能になっている。
図書館に必要なのはビッグデータではなく、オープンデータなのだと思う。
@kamemura2 必要の無い情報を含めることでリスクを上げる必要はないと思います。 https://twitter.com/kumagai_chiba/status/368129416246747136
@lamaille_mayuko @Rutice_jp あるテーマについて学習する際に、自分なりに探した本に加えて、このテーマではこうした本も借りられているということが分かると助かりますし、そこに司書が過去に類似のテーマでレファレンス対応したものも出ると有り難いです。
https://twitter.com/kumagai_chiba/status/368255793851678720
@lamaille_mayuko @Rutice_jp Amazonのレコメンドにあるような購買履歴からのレコメンドは想定していません。それは踏み込み過ぎと考えています。ある本を借りる場合の関連書籍の紹介などを想定しています
https://twitter.com/kumagai_chiba/status/368216209939906560
@lamaille_mayuko 名前等の個人が特定できる情報を削除し、「ある本を借りた人がこの本も借りている」というデータにするという話です。人口100人未満の村図書館とかの特殊事例は除きます
https://mobile.twitter.com/kumagai_chiba/status/367887181513113600
*5
平成23年度の総貸出数は523万冊、年間貸出利用者率は市民の14%
http://www.library.city.chiba.jp/management/h24hyokakoumoku.pdf
千葉市の推計人口 962,988(平成24年1月1日現在)
http://www.city.chiba.jp/sogoseisaku/sogoseisaku/tokei/201201.html
*6 千葉市は人口ランキング13位
http://ja.wikipedia.org/wiki/日本の市の人口順位