打切りデータに基づくノンパラメトリック最尤推定量であるKaplan-Meier推定量$\hat{F}_n (t)$ (Kaplan and Meier (1958))は, 生存時間データの解析において最も重要な推定量であり, これに対する自己一致方程式がEfron (1967)によって示されている. この方程式は, 打切りデータを欠測値のある不完全データとみなしたときに, その不完全部分がKaplan-Meier推定量においてどのように推定(補完)されているかを示す重要なものである. 本論文において, Kaplan-Meier積分$\int \phi (t) \, d \hat{F}_n (t)$に対する自己一致方程式を導出した. この方程式は, 被積分関数$\phi$を$\phi(t)= I(t > x)$とするとEfron (1967)の自己一致方程式に一致するという意味において, その一般化である. ただし, $I(A)$を集合$A$の定義関数とする. また, 本論文において, Kaplan-Meier積分の自己一致方程式の応用として, 次の三つの問題について議論した. (1) 打切りデータに基づくパラメトリック推定量の漸近一致性に関する結果(Suzukawa, Imai & Sato, 2001)をデータの不完全性の補完という観点から解釈する問題, (2) 単調関数$\phi$に対して, $\int \phi (t) \, d \hat{F}_n (t) =\int \phi (t) \, d \hat{F}_{n}^{(\phi)}(t)$をみたす分布$\hat{F}_{n}^{(\phi)}$を構成する問題, (3) 打切りを受けたという条件のもとでの条件付平均生存時間の推定問題.
Key words: Censored data, Kaplan-Meier estimator, Parametric estimation, Product limit estimator尺度混在データに関する冗長性分析の手法(QRDA)が提案され,人工データを用いてその有効性は評価されているが,実際の現象解析に応用された例はない.QRDA手法の特徴は,ある変数セットが他の変数セットに従属する関係を分析し,かつ各変数セットが連続変量とカテゴリカル変量から成り立つことが特徴である.この研究では,その特徴を考慮し,臭気公害に関する実験データにQRDA手法を適用し,心理変数セットが物理変数セットに依存する従属関係を分析した.その結果QRDAは,従来の分析法よりも, 心理変数と物理変数の従属関係を明確に把握し,かつ潜在変量の個数を定めることが可能である点で,有用であることを,現実のデータ解析によって示した.
Key words: Data analysis, Mixed measurement levels, Reduced rank regression, Redundancy analysis, Sensory inspection data近年, 統計解析のためのソフトウェア (以下, 統計ソフト) の開発が企業, 研究者等により盛んに行われている.
その利用者についても, 一部の研究者, 実務者ばかりでなく, 学生をはじめ様々なレベルに広がっている.
このような流れの中で, 統計ソフトに対する要望も多種多様であり, そのすべてを
1 つの統計ソフトで答えることは困難である.
本論文では, 入出力用のインターフェースと統計エンジンを 切り離すことにより,
多様な利用に対応できる統計解析ライブラリ (DLLSA: Dynamic Link Library for
Statistical Analysis) の構築を 提案する. このライブラリは過去に様々な言語で開発された
統計ソフトを Dynamic Link Library (DLL) の形に変換したもので, DLL の特性により様々な利用が可能である.
なお, DLLSA は http://www.sci.kagoshima-u.ac.jp/dllsa/ にて公開されており,
自由に利用できる状態である.
ロジスティック回帰の推測では, 現在では最尤法が標準的に用いられるようになっているが, 現実のデータ解析の場面では, 最尤推定の持つ漸近的な性質が成り立たない場面が多々ある. 1つの解決策は, あるパラメータについて推測を行う場合, 残りのパラメータの十分統計量を与えた下での条件付並べ替え分布に基づいた正確な推測を行うことである. SASではリリース8.1からロジスティック回帰においてこの正確な推測が可能になった. 正確な推測の概論と, 医薬分野における適用例を紹介する.