Site Calendar

サイトカレンダをスキップ

2019年 12月
«
»
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

NAVI

ログイン

ログイン

新着情報

記事

-

コメント (2日)

-

トラックバック (2日)

-

リンク (2週)

新しいリンクはありません

QRコード

QR code

アンケート

三国志ニュースのレポート系記事

三国志ニュースで書いて欲しいレポート系記事はどれ?

  •  三国志フェス
  •  三国志学会大会
  •  関プチ5全国ツアー
  •  魏晋南北朝史研究会関連
  •  三國夜話
  •  六間道三国志祭
  •  三国志TERAKOYA4
  •  三国志 義兄弟の宴
  •  東アジアの『三国志演義』/ベトナムの『三国志演義』
  •  zip,torrent(トレント),rar,lha,mediafire,pdf,DL(ダウンロード),nyaa等を含む検索語句(違法なフリーライド・無料閲覧関連)、あるいはBD・DVD自作ラベル、カスタムレーベル等を含む検索語句(著作権・肖像権侵害関連)に関する調査・研究

結果
他のアンケートを見る | 50 投票 | 0 コメント

PR

清岡的見解:ねこまんまさんについて http://tinyurl.com/nekonomanma3
よくわかるねこまんまさんの問題行動 pdf
gif

メモ2:「アクセス集計に見られる現代日本における三国志由来事項の変容と浸透」


  • 2009年8月 3日(月) 12:55 JST
  • 投稿者:
    清岡美津夫
  • 閲覧数
    1,487
研究 ※前記事 メモ1:「アクセス集計に見られる現代日本における三国志由来事項の変容と浸透」

 アクセス集計のペースが1日当たり4日分から3日分にペースダウンしたものの、2007年12月17日分まで進み作業の目処が立ち、また並行して、前記事に引き続き、発表原稿へも当日配るレジュメへも転用できるような原稿を書いている。
 意欲を高めるために、前記事で「序言」を公開したわけだけど、現行ではその文に日本におけるインターネットの利用状況に関する文を加えている。それはウェブ上に公開されている総務省による平成18年「通信利用動向調査」を引用した上で、それを論拠にし書かれている。前記事を編集し、その部分を公開しても良いのだけど、いちいち変更した分を編集するときりがないため、前記事に書いた部分を第一稿として留め、最終稿は当日にとっておくことにする。

 それで今回、前記事の「序言」に続き、「集計方法」を公開する。もちろん前記事と同じく改められる可能性は高いが、変更箇所を追って公開しない予定。また、「メモ1」「メモ2」と続いたが、次は「3. 集計結果と考察」となり、報告の肝の部分になるため、発表前に公開される可能性は低い。但し、発表者の意欲を高めるため、断片的に公開される可能性は捨てきれない。
 主に「2-4. 検索語句の分類」については下記、関連記事を大きく参考にした(とは言ってもそこの冒頭で示唆するように、元々、発表原稿に流用する目的で書いたんだけどね)。

※関連記事 メモ:検索ワードの分類


2. 集計方法

2-1. 観測点

 アクセス集計を行う観測点として以下の二つのウェブサイトの全ページを選んだ。

・三国志ファンのためのサポート掲示板 (URL http://cte.main.jp/
 このウェブサイトはワールドワイドウェブ(以下、WWWと略す)上にある非同期性のコミュニティ(交流場所)であり、参加者は文章を介在させ情報授受を行うシステム、いわゆる「掲示板」または「BBS」と呼ばれるシステムで動作している。ゲームを中心とした娯楽関連の話題を排除する規制があるため、結果的に三国由来事項は『三国志』や『三国演義』中心となっており、それらを反映したアクセスが観測されやすい。

・三国志ニュース (URL http://cte.main.jp/newsch/
 このウェブサイトは三国由来事項を含む即時性の高い情報を個人がWWW上で発信するサイトであり、記事単位で構成されているシステム、いわゆる「ブログ」または「weblog」というシステムで動作している。漫画やゲームの販売状況などの娯楽作品の情報も取り扱う。そのため、結果的に前述した「三国志ファンのためのサポート掲示板」に対し相補的な情報となっており、『三国志』や『三国演義』以外の娯楽作品に対するアクセスが観測されやすい。

2-2. 観測スクリプト

 アクセスの観測に、アクセス解析用フリーソフト『Access Report』(Copyright KENT-WEB URL http://www.kent-web.com/)を基礎として機能改良された『access cgi ver.3.11』(Copyright at works URL http://atworks-online.net/)を用いた。なお、当スクリプトをJavaScriptで動作する設定にしている関係で、携帯電話によるアクセスは充分に観測されなかった。
(※発表では、特別なスクリプトではないことを言い添える)

2-3. 観測データ

 一般的に、任意の者がWWW上の任意のウェブサイトへアクセスする場合、閲覧に使用するブラウザからウェブサイトが格納されるWWWサーバーへ様々な情報が渡される。それらの情報として、リンク元のURL、使用ブラウザ名とそのバージョン、アクセス元のIPアドレス、アクセス元のホスト名などが挙げられる。当報告ではそれらの中からアクセス元の個人情報が含まれないリンク元のURLを利用する。
 観測されるリンク元のURLの中で、社会からの三国由来事項への関心が特に反映される検索サイトのURLを抽出する。検索サイト(クロール型)のURLには、一般的に、アクセス元のブラウザ使用者が種々の検索サイトにおける検索フォームへ各々入力したキーワード(以下、検索語句と略す)が含まれている。当報告では前述した観測点において2005年3月から2007年12月までのアクセス集計により得られた検索語句を起点として考察を進める。

2-4. 検索語句の分類

 理論上、観測される検索語句は、表現の揺らぎや誤認・誤変換を含め、観測点に含まれる単語全てが対象となる。それらを整理せず包括的に集計すれば、煩雑になり集計結果から有意性が見出せない可能性が高いため、検索語句を分類し理解しやすい状態にする必要が生じる。

・検索語句の取捨
 分類の前処理として、検索語句に含まれる三国由来事項の有無に応じ、取捨を行う。例えば、「吉川英治」という検索語句がある場合を示す。「吉川英治」は『三国演義』を題材とし『三国志』と題名を付けた小説を執筆したがが、他にも「三国志」と無関係な小説を数多く執筆している。そのため、検索者にとって検索語句「吉川英治」に三国由来事項を含めていない可能性が高いと見なし、次の処理を行わず、三国由来事項として数えない。これとは逆の結果として、「吉川英治 張飛」という検索語句であれば、三国由来事項を含む見なし、次の分類処理へと移る。

・分類の三階層
 検索語句の分類には、大中小の三つの階層を設ける。大分類は形態、メディアなどを基準にし、中分類は文献や作品タイトルなどを基準にし、小分類は中分類に包括される作品タイトルなど、または中分類の内容に関わる項目や事象などを基準としている。具体的な分類の項目は後述の「3. 集計結果と考察」の項で触れられる。

・分類の規則
 複数の意味が取れる検索語句について、検索者が何を意図して検索しているか観測者からは特定できないため、本来の意味により近くなるように分類を行う(包括規則)。例えば検索語句が単に「三国志」だけである場合、可能性としては史書の陳寿撰『三国志』、漫画の横山光輝/著『三国志』、ゲームのSLG『三國志』など様々あるが、特定できないことを認め、全て本来の『三国志』と解釈し大分類に「歴史」、中分類に「三国志」として分類する。
 同じく複数の意味が取れる検索語句について、本来の意味が判別しにくい場合であれば、より一般性の高い意味を選び分類する(一般化規則)。例えば、「貂蝉 三国志」と検索語句があったとすれば、周知の通り『三国志』に人物として「貂蝉」は記載されておらず、『至治新刊全相平話三国志』、『三国演義』、シミュレーションゲーム『三國志』シリーズなど種々想定できるが、より一般性の高い『三国演義』を選び、「古典/三国演義/貂蝉」に分類する。
 1カウントのアクセスに複数の検索語句が観測され、かつ1カウントとして分類できない場合は1カウントを等分する(分配規則)。例えば、1カウントのアクセス中に「曹操 劉備」という並列関係にある2つの検索語句が観測されれば、「歴史/三国志/曹操」と「歴史/三国志/劉備」の2つの階層に分類し、各0.5カウントとする。
 基本的に、検索サイトにおいて検索語句は校正されず、その上、ある程度、誤りがあっても目的のウェブページに辿り着けるという許容性があるため、技術面に限定すれば検索語句に正確性が必要とされていない。それを補うため、分類に際して検索語句を訂正する作業が必要とされる(訂正規則)。例えば「周喩」から「周瑜」への訂正、「三国志ガンダム」から「BB戦士三国伝」への訂正などがあげられる。


※次記事 メモ3:「アクセス集計に見られる現代日本における三国志由来事項の変容と浸透」

トラックバック

このエントリのトラックバックURL:
http://cte.main.jp/newsch/trackback.php/1359
  • メモ2:「アクセス集計に見られる現代日本における三国志由来事項の変容と浸透」
  • 0コメント
  • アカウント登録
表示形式
コメント投稿

サイト管理者はコメントに関する責任を負いません。