|
|
「計算機統計学」第16巻1号 目次・要旨 |
会長就任にあたって |
計算機統計学会の過去と未来 |
垂水共之 |
論文
|
コンピュータによる小論文の自動採点システムJessの試作 |
石岡恒憲・亀田雅之 |
多変量t母集団におけるMANOVAの次元検定について |
吉田清隆・今井英幸・佐藤義治 |
分割表における秘匿セルの簡易補完法および,そのオンラインシステムへの実装について |
藤野友和・垂水共之 |
正則化局所尤度法に基づく非線形回帰モデリング |
野中美佑・安道知寛・小西貞則 |
総合報告 |
グリッドとPIV仮想研究所 |
門岡良昌・田子精男 |
ソフトウェア記事
|
汎用データマイニングツール Visual Mining Studioの紹介 |
雪島正敏・田澤 司・徐 良為 |
学会活動記事
|
日本計算機統計学会第16回シンポジウム報告 |
柴田義貞 |
関連学会記事
|
第4回ARSに参加して |
弘 新太郎 |
|
|
|
|
|
コンピュータによる小論文の自動採点システムJessの試作
石岡恒憲・亀田雅之
アメリカで実施される適性試験のひとつであるGMAT (Graduate management Admission
Test)において, 実際に小論文の採点に用いられているe-raterを参考にして, その日本語版ともいうべきJessを試作した.
Jessは, 文章の形式的な側面, いわゆる文章作法を評価する「修辞」と, アイディアが理路整然と表現されていることを示す「論理構成」と,
トピックに関連した語彙が用いられているかを示す「内容」の3つの観点から小論文を評価する.
毎日新聞の社説およびコラム(「余録」)を学習し, これを模範とした場合に適切でないと判断される採点細目に対して減点することで採点を行なう.
また書かれた小論文の診断情報を提示する.
システムは現在UNIX上で動作し, 800--1,600字の小論文を通常能力のパソコン(Plat'Home Standard System801S; Intel Pentium III 800MHz; RedHat7.2)で1秒程度で処理する.
|
|
多変量t母集団におけるMANOVAの次元検定について
吉田清隆・今井英幸・佐藤義治
多変量分散分析(MANOVA)における次元に関する検定問題では, LR(Likelihood Ratio)型,
LH(Lawley-Hotelling)型, BNP(Bartlett-Nanda-Pillai)型の検定方式が 代表的であるが,
これらの帰無分布は局外母数に依存することが知られている.
Yoshida et al. (2002) は, elliptical母集団の下で, 上記3タイプの帰無分布に関して上界となる, 局外母数に依存しない新たな検定方式を提案し,
contaminated正規母集団の下では, LR型, LH型については, 帰無分布に関して上限になることを証明している.
本稿では, 多変量$t$母集団における次元検定について考察し, Yoshida et al. (2002) が提案した検定方式は,
contaminated正規母集団のときと同様, LR型, LH型については, 帰無分布に関して上限になることを示した.
|
|
分割表における秘匿セルの簡易補完法および,そのオンラインシステムへの実装について
藤野友和・垂水共之
本論文では,統計調査における集計表を公開する際,個人情報の漏洩を防ぐために秘匿処理されたセルに属する個体数を補完する方法について提案し,そのシミュレーションによる評価を行った結果を示す.
また,オンラインでの調査結果の開示システムにこの機能を実装することで,利用者が秘匿セルの補完処理にかける労力を軽減することが可能となる.
|
|
正則化局所尤度法に基づく非線形回帰モデリング
野中美佑・安道知寛・小西貞則
複雑な非線形構造を有するデータに内在する情報を取り出す方法の一つとして, 局所尤度法が提案されている.
局所尤度法の利点は, 重み関数を用いることによって推定点の近くのデータに対してより高いウエイトを与え,
データの構造を局所的に捉えられることにある. しかし, この手法の問題点の一つとして推定量の不安定性が挙げられ,
バンド幅と次数の取り方によっては推定量が発散する場合がある.
本研究では, この問題を解決するために, 局所尤度法と正則化法を組み合わせた正則化局所尤度法に基づいてモデルを推定する手法を提案する.
モデル構築において本質的となる点は,カーネル関数のバンド幅,多項式の次数,及び正則化パラメータの選択であるが,これらの選択を情報量の観点から考察し,新たにモデル評価規準を導出する.また,実データの分析,および数値実験を通して提案する手法の有効性を検証する.
|
|
|
グリッドとPIV仮想研究所
門岡良昌・田子精男
近年IT分野ではグリッドの技術が注目を集めている. 一方,流体現象解明に有効な実験手段として粒子画像流速測定法(Particle Image Velocimetry:PIV)がある. このPIV技術は2次元から3次元への進化にともない,速度ベクトル計算のための高性能計算機や実験結果および解析結果の保存のための大容量ストレージ,そして解析結果の可視化のための高性能可視化エンジンなどのいわゆるITリソースが必要となる. しかしこのようなITリソースを個々の研究者が用意することは難しい. そこでグリッド技術を活用し,インターネットを経由して流体研究者が必要なITリソースを共同利用し,さらに協調研究を行う場としてPIV仮想研究所(PIV-VL)を構築している. 本稿では,最初にグリッドに関する技術について解説し,PIV-VLの概要とPIV-VLを戦闘機のデルタ翼に適用した結果について報告する.
|
|
|
汎用データマイニングツール Visual Mining Studioの紹介
雪島正敏・田澤 司・徐 良為
データマイニングとは膨大なデータの中から隠された有益な知識を発掘するプロセスである.
知識が隠されているために何を調べて良いかの指針が無く,膨大な量のため,全ての可能性について探索する事は困難である.
そこで半ば自動的に効率よくデータを探索する道具が必要になる. 本報告では,その様な道具として,汎用データマイニングツール
Visual Mining Studioを紹介する. Visual Mining Studioは株式会社数理システムによって独自に開発されたデータマイニングツールであり,データの前処理・加工から探索までの一連のデータマイニング作業を視覚的に行う事をサポートするツールである.
|
|
|
|
|
|
|
|
|
|
|
|