|
|
「計算機統計学」第18巻1号 目次・要旨
|
会長就任挨拶
|
ゲノムの時代と計算機統計学 |
魚井 徹 |
論文
|
x-means法改良の一提案 - k-means法の逐次繰り返しとクラスターの再併合 |
石岡恒憲 |
Javaによる統計システムへのデータマイニング機能の実装 |
小林郁典・中野純司・山本由和・藤原丈史 |
シミュレーションによる最深回帰推定量の性能評価 |
藤木美江・白旗慎吾 |
ソフトウェア記事
|
テキストマイニングツール Text Mining Studioの紹介 |
菊地 淳 |
関連学会記事
|
ISI2005に参加して |
|
冨田 誠
|
|
|
|
x-means法改良の一提案 - k-means法の逐次繰り返しとクラスターの再併合
石岡恒憲
k-means法の逐次繰り返しとBICによる分割停止基準を用いることで, クラスター数を自動的に決定するアルゴリズムx-means法を改
良した. その手続きは, 分割順序に起因する好ましくないと考えられる分割クラスターを併合するものである. この併合操作により, さま
ざまな事例に対して, 適当と考えられるクラスター数を得ることのできる事例の数が大幅に増加することが確認された. この方法は, クラス
ター数未知のときに発見的な方法に拠らずに情報理論的に最適と考えられるクラスター数を求めることができる. その計算量は標本サイズを
N, クラスター数をkとしたときO(N log k)となる. |
|
Javaによる統計システムへのデータマイニング機能の実装
小林郁典・中野純司・山本由和・藤原丈史
統計解析システム上でデータマイニング手法による解析を利用者に提供するために, Javaの技術に基づいて開発されている統計解析シス
テムJaspにデータマイニングができる機能を追加した. このために, 機械学習ソフトとして有名なWekaのJavaクラスライブラリをJasp
に組み込み, データマイニング手法に対応した関数型のコマンドをいくつか用意した. 利用者は, Jasp上で解析データを用意し, 統計解
析用のコマンドを利用して統計グラフを描き, C4.5, サポートベクターマシン, APRIORI法やK-Means法などのデータマイニング手法を解析データに適用することができる. |
|
シミュレーションによる最深回帰推定量の性能評価
藤木美江・白旗慎吾
本論文ではRegression Depthを基に導き出された最深回帰推定量について議論する. この推定量は, 従来の最小2乗法に比べて正規分布から
のずれと外れ値による影響が少なく, ロバスト回帰推定量に比べて効率の低下も少ない. 頑健性を調べるには 大域的な信頼性を測る破綻点
と, 局所的なロバストネスを測る影響関数という尺度がある. これらを用いて推定量のロバストネスについて調べた結果, 最深回帰推定量は高い
破綻点を保ちながら, 高い漸近効率をもつことがわかった. 回帰depthの理論的な性質をまとめるとともに, シミュレーション実験により,
他のロバスト回帰推定量との比較から性能評価を行なった. その実験結果により, 実データ解析に適用可能であることを示した.
|
|
テキストマイニングツール Text Mining Studioの紹介
菊地 淳
(株)数理システムが提供するテキストマイニングツールText Mining Studioを紹介する. 本ソフトウェアは, 自由記述形式のテキストデー
タを対象とした分析環境を提供するものであり, 分かち書きや辞書といったテキスト処理機能と, 頻度分析, 時系列分析, 注目分析, 評判分
析, 特徴分析, 話題分析といったテキストデータに対する分析機能を簡単な操作で利用できることを特徴としている. さらに, 汎用データマ
イニングツールVisual Minig Studio と連携することにより, データマイニングとテキストマイニングを融合した「統合マイニングプラット
ホーム」が実現される.
|
|
|
|
|
|
|
|
|
|
|
|