|
|
「計算機統計学」第22巻1号 目次・要旨
|
会長就任挨拶
|
計算機統計学会の今後 |
山下 浩 |
論文
|
データ適応型分布に基づく多分岐樹木構造接近法 |
下川敏雄・後藤昌司 |
再発事象の変化点の検出のための近似分布を用いた検定法 |
西島啓二・鎌倉稔成 |
線形計画法による改定IP-OLDFの計算時間の改善 |
新村秀一 |
学会活動記事
|
日本計算機統計学会第22回シンポジウム報告 |
|
松原義弘・坂本 亘 |
欧文誌掲載論文概要: J. Japanese Soc. Comp. Statist., 21(1), 2008 |
|
濱崎俊光 |
関連学会記事
|
第4回IASCに参加して |
|
高橋一磨 |
|
|
|
データ適応型分布に基づく多分岐樹木構造接近法
下川敏雄・後藤昌司
生存時間研究において, 樹木構造接近法は患者の生存時間の予後因子を評価するための強力な手段である. 既存の生存時間研究における樹木構造接近法のほとんどが2分岐で構成されているが, 応答(生存時間)に対する予後因子を2分岐で単純に扱える場合は少ない. 衛藤他(2007) は, 予後因子の交互作用効果を(比較的)簡単なグラフィクスで表示できる多分岐型樹木構造接近法を提案している. この方法は, 分岐基準にノンパラメトリック(検定) 統計量を用いて構成されているが, データ省察から解釈までの手順に論理的な一貫性を保持するには, 応答に何らかの潜在基礎分布を想定したほうが好ましい. 本論文では, その潜在基礎分布にデータ適応型分布, それもベキ正規分布を想定したもとで多分岐樹木構造接近法を構成する. その性能を, 数個の文献事例およびシミュレーションにより評価した. その結果, 既存のノンパラメトリック検定統計量に基づく多分岐樹木構造接近法と比肩し得る性能をもち, 結果の解釈が容易であった. データの省察から予後因子の探索までを一貫して整合的に行うことができる点で, ここで提示したデータ適応型多分岐樹木構造接近法が推奨できる. |
|
再発事象の変化点の検出のための近似分布を用いた検定法
西島啓二・鎌倉稔成
本研究では, 再発事象の発現が定常ポアソン過程に従うと仮定し, 再発事象の発現頻度が変化する点(変化点)の存在に関する仮説検定を考え, 検定統計量の帰無分布について考察した. 再発事象が, 件発現した場合の検定統計量の帰無分布は, 互いに独立でない, n-2個の自由度1のカイ2乗分布(χ12分布)の最大値の分布で与えられる. しかしながら, その分布を導出することは難しいため, 帰無分布の下界及び上界が, それぞれ, 独立な, n-2個のχ12分布分布の最大値の分布及びχ12分布分布で与えられることを理論的に示し, 下界及び上界を用いた線形結合により, 帰無分布を近似することを検討した. 本研究で導出した下界及び上界を用いた近似は,必ずしも近似が十分でないこともあることから, さらに, 経験分布関数による近似について検討した. シミュレーション研究の結果, 検定統計量の帰無分布は, 発現件数nに応じたガンマ分布による近似が可能であると考えられ, ガンマ分布のパラメータを, 発現件数nに基づき決定する回帰式を求めた. このガンマ分布を用いた経験分布による近似は, 全ての領域で帰無分布の良い近似を与え, また, 検定における第1種の過誤確率を名目の有意水準に保つ観点からも, 下界及び上界を用いた近似に比べて, 帰無分布の良い近似を与えることがわかった. |
|
線形計画法による改定IP-OLDFの計算時間の改善
新村秀一
改定IP-OLDF (Revised Optiomal Linear Discriminant Function using Integer Programming)は, 整数計画法を用いて, 教師データで最小誤分類数(the minimum number of misclassifications, MNM) を直接求める線形判別関数である. しかし, 整数計画法は計算時間がかかるため,線形計画法を用いて計算時間を短くすることを試みた. 第1段階で, 改定LP-OLDF (Revised Optiomal Linear Discriminant Function using Linear Programming) をデータに適用する. そして, サポート・ベクタ(Support Vector, SV)で正しく判別されたデータと判別されないデータに分ける. 第2段階で, 改定IP-OLDFを正しく判別されないデータに適用する. この手法を改定IPLP-OLDF と呼ぶことにする. 本研究では, 改定IPLP-OLDF で計算時間をどれだけ短くできるか, そして正しいMNMが得られるか否かを以下のように検証する. 4種類の実データを教師データとし, 教師データから2万件のリサンプリング・データを作成し評価データとする. これらのデータで,計149個の説明変数の全ての組み合わせモデルで計算時間と誤分類数を求めた. 分析結果から, 次のことがわかった.- 改定IPLP-OLDF は, 改定IP-OLDF よりも計算時間が著しく改善された.
- 改定IPLP-OLDF で得られた誤分類数は, 教師データでは全てMNMと一致した.
- 評価データでは, 多くのモデルで改定IPLP-OLDFと改定IP-OLDFで得られた誤分類数は一致した. 一致しない場合でも, 差は大きくなかった.
- 教師データと評価データの誤分類確率の差は, 判別成績の良いモデルでは, ほぼ2%以下に収まった. すなわち, 改定IP-OLDFと改定IPLP-OLDF は汎化能力が高い手法といえる.
以上から, 現実の問題に適用する場合, 改定IP-OLDF に代わって改定IPLP-OLDF を用いればよいことがわかった. |
|
|
|
|
|
|
|
|
|
|
|
|
|