変数の一部を用いた主成分分析 (Tanaka \& Mori, 1997 など) は, 変数の一 部を用いて元の変数全体を最もよく代表する総合指標を抽出しようというもの であるが, その一部の変数としてできるかぎりよい変数群を計算コストを考慮 して選択する手順について, 数値例に基づき検討する. 具体的には, BackwardとForwardの変数選択手順と, 1変数に関してBackwardと Forwardを交互に繰り返していく2種類のStepwiseの計4手順を提唱し, これら の選択結果をすべての組み合わせを調べた結果および先行研究の手法による結果と 比較して評価した. その結果, 4つの手順はすべての組み合わせを調べる変数選択手順と比較して顕著 な差は見られないことから計算コストの面で有効であること, 4手順の中では Backward系よりForward系の方が, また単純選択よりStepwise手順の方がよい 結果が得られること, 他の手法との比較では提唱した手順の方がよりよい総合 指標が得られる変数群を選択できることが明らかになった.
Key words: Modified PCA, Stepwise selection, PCA of instrumental variables, Computational cost
分散が等しい2標本モデルにおける平均の同等性の検定法と平均の差の推定法
として, 正規分布の下で最良なパラメトリック法, 順位によるノンパラメトリッ
ク法, Huber (1964) の頑健性をもつ漸近的に正規分布の近傍で最良となるセ
ミパラメトリック法がある.
これら3種の検定統計量に基づく並べ替え検定のアルゴリズムを紹介し, シミュ
レーションにより小標本でのそれらの検出力の比較を行う.
さらに, セミパラメトリック推定法についてアルゴリズムを紹介し, 平均2乗
誤差により小標本でのパラメトリック推定法, ノンパラメトリック推定法, セ
ミパラメトリック推定法の比較を行う.
これらの比較により, 観測値が正規分布ではないが正規分布に近い分布に従っ
ていればセミパラメトリック法を使うことを, 観測値が正規分布から大きく離
れた分布に従う場合はノンパラメトリック法を使うことが勧められる.
生のデータを パラメトリック法, ノンパラメトリック法, セミパラメトリッ
ク法のいずれを使って解析すればよいかはブートストラップ法により選択でき
るが, ブートストラップによる選択法の問題点を疑似乱数と実際の生のデータ
により指摘し, 手法の効率をブートストラップにより推定した場合, その推定
量は実際の効率とはかなり異なることが検証できる.
制約付き主成分分析法(Constrained Principal Component Analysis, CPCA 法)を作文評価データの解析に適用した. 評価対象の作文は, 聴覚障害(「聴障」と略称)の学生及び対照群としての健聴 の学生それぞれが書いたもの各4篇, 計8篇である. 評価者は, 聴能(聴障対 健聴)と世代(学生対教官)のそれぞれの対照群から計65人を選定した. このデー タ行列(65×8型)にCPCA法を適用した. こうして得られた聴障者と健聴者 とに関する知見は, 聴覚障害学生の授業実施に役立てた. なお, S言語で開発 したCPCA法のプログラムを紹介した.
Key words: Constrained PCA, Auditory handicap, Evaluation, S-language擬似乱数の乱数性を統計的に検定する方法の一つとして, random walk の見本関数の汎関数を用いる方法を提案し, それを実際の擬似乱数に適応することにより得られる結果等について 報告する.
Key words: M-sequences, Additive number generators
Webを利用した統計関連のサービスとしては, 統計データを有するものが, そ
の要約データを公表するものと, ブラウザに表示されたフォームにデータを入
力し, 解析手法を選択することにより結果を返すものに大別される.
統計データを持っている場合に, 利用者に要約方法を選択させ, 利用者の要求
に応じた要約データを提供する方法について, 岡山行動圏データを利用した実
用例を紹介し, 公開する側のデータ編集作業の軽減と利用者の要求を同時に満
たすシステムについて論じる.
更に, そのシステムにおいて利用したCGI (Common Gateway Interface)という
方法について紹介し, CGIを利用したデータ解析およびグラフ表示の実現方法
についての事例を紹介する.