本論文では, システムの入力と出力との間に成立する条件つき確率分布を, 入力分布を適切に選択することにより, 学習データから推定する問題を議論する. 観測者がシステムへの入力を選択できるような学習方式を, 能動学習という. 本論文では, 学習を行うときに設定したモデルは, 一般には間違っているという現実的な仮定を採用する. モデルが間違っているときに能動学習を行うと, 最尤推定量は一般に一致性をもたない.そこで, 一致性を回復するために, 重み付き最尤推定量を用いた能動学習のアルゴリズムを提案する. また, そのアルゴリズムの汎化誤差を, 統計的漸近論を用いて計算する. さらに, 簡単な数値実験を行い, 漸近論による解析結果の妥当性について考察する.
Key words: Optimal experimental design, Kullback-Leibler divergence, Generalization error, Statistical asymptotic theory
主成分分析における固有ベクトルの検定問題に関して, 4つのノンパラメトリック
検定法を提案している. これらの方法は主成分スコアを用いた等分散性の
ノンパラメトリック法として知られているMoses検定を応用して構築された
ものである.
シミュレーション実験の結果から, 母集団分布が正規分布でない場合は,
Anderson(1963)による検定統計量を用いるのは適切ではないことが判明した.
また, この論文で提案した方法は正規性から離れた場合であっても十分な
精度をもち, 実用的であることが示された.
生のデータをパラメトリック法, ノンパラメトリック法, セミパラメトリッ
ク法のいずれを使って解析すればよいかはブートストラップ法により選択でき
るが, ブートストラップによる選択法の問題点を疑似乱数と実際の生のデータ
により指摘し, 手法の効率をブートストラップにより推定した場合, その推定
量は実際の効率とはかなり異なることが検証できる.
判別分析は, 回帰分析と同様に, 理論と応用面で重要な手法である. 回帰分析のアルゴリズムとしては, 最小自乗法が良く用いられているが, 線形計画法(LP)を用いたLAV回帰分析もよく知られている. 一方, 判別分析ではFisherの線形判別関数が代表的であるが, 数理計画 法を用いたアルゴリズムはこれまであまり知られていない. 本論文では, 線形計画法(LP)と整数計画法(IP)を用いた2つの最適線形判別関 数(IP判別関数, LP判別関数)を提案した. Fisherの線形判別関数や2次判別関数と比較評価のため, Fisherのアイリスデー タ(バー シクルとバージニカの2群)と児頭骨盤不均衡を判定するため鈴村博士らによって 集められた医学データを用いた. このデータは, 180例の自然分娩群と60例の帝 王切開群である. 説明変数は, 19個あるが, 3つの多重共線性を示す関係がある. このデータから2つの結果を得た. 最初は, IP判別関数の誤分類数は, 変数増 加法と減少法で得られたどのモデルにおいても, 線形判別関数や2次判別関数やLP判別関数と 比較して少なかった. つぎに, 19変数と多重共線性のある3変数を省いた16変数の 逐次変数選択法で得られたモデル系列でIP判別関数の誤分類数を比較すると, 後者 は前者に比べ1変数から16変数のどの場合でも誤分類数は少なかった. しかし, 6変数以上では, 19変数の逐次変数選択法で選ばれたモデル系列の決定係数は16 変数のそれに比べ高かった. 以上から, 2群が多変量正規分布に従わなかったり分散共分散が等しくない場 合, IP判別関数は他の判別関数に比べ成績がよいことがわかった. また, 多重共線性を示す変数を省くと, 誤分類数が改善されるモデル系列があ ることがわかった.
Key words: Fisher's linear discriminant function, Integer Programming, IP linear discriminant function, LP linear discriminant function, Multi-collinearityパヴラクによって提唱されたラフ集合論の基礎的部分を概観した後, その様相論理との関係を明確にし, ラフ集合論の一般化に進む. 次に, データ・マイニングにおける相関ルールに関して, ラフ集合・様相論理の立場からの解釈を説明する. 最後に, ラフ集合論の意義を論じる.
Key words: Classification, Approximation, Kripke semantics, Association rules
多次元データ解析において, 動的なグラフィックスの活用は
極めて有効である. また, 昨今のインターネットの普及と相まって,
従来からの問題点である機種依存性の排除を可能としたJava言語が
出現してきている.
本稿ではJavaについて概説するとともに,
Javaで作成され, World Wide Web上で動作する「動的な対散布図」について,
報告する.