本ウェブサイトは2012年3月末をもって閉鎖いたしました。このページに掲載している内容は閉鎖時点のものです。[2012年3月]

私とデータ解析の関わり


稲葉 太一

(人間環境学専攻、環境基礎論講座)

写真
多くの方のお陰で名前を連ねることが出来た本です

社会貢献レポートを依頼されて、「困ったな」と感じています。自分のやっていることのうちで、果たして何が社会に貢献しているのか? よく分りません。お恥ずかしい言い方ながら、小さい頃から社会の役に立つ人間になりたいとは考えておりました。でもいざ、正面から「社会の役に立っているか」と聞かれると答えに困ります。しかし、レポートの提出期限はやってきます。そこで、取り敢えず自分の行っている事を率直に述べ、後のご判断は読者にお任せしたいと思います。

そもそも私は、小さい頃から算数・数学が大好きで、大阪大学の理学部数学科に入学しました。その後、水泳部に入部して人との和の大切さを知りました。その関係もあって大阪大学健康体育部に事務補佐員として就職することとなり、データの分析を志しました。ここで、自分の分析能力不足を痛感し、1年後に大阪大学基礎工学研究科の推計学講座に進学し直して、理論的に統計学を勉強することにしました。最初に赴任した名古屋大学工学部では、教務員としては碌な事はしなかったのですが、データ解析の真髄と面白さを教えて頂く事ができました。

現在の私が行っている活動は3つに分類できると思います。1つ目は、社会調査との関わりです。学生時代のクラブの先輩の紹介で、JGSS (日本版一般社会調査) というプロジェクトに参加させて頂くことができました。このプロジェクトは、大阪商業大学と東京大学社会科学研究所の共同研究で、大規模な調査の結果を研究者向けに公開し、データを共有するというものです。私は調査方法の検討を依頼され微力ながらコメントしたのが始まりです。最も印象に残っているのは、プロジェクトにとっては大きなピンチでもあった「住民基本台帳法の改正」のときに行った体験抽出です。

当時、住民基本台帳は原則公開であったのが、プライバシーを守る機運の高まりによって、社会調査における適正なサンプリングのための閲覧でさえも制限される可能性がありました。少々大げさにいうと社会調査の危機ともいえる状況での体験抽出には、多くの皆さんが参加され報告書を作成されました。私はこれらの報告書を読ませて頂くことができ、実際に実現可能な抽出方法を考える幸運に恵まれました。多様な名簿から短時間で適切な実現可能であるサンプリング方法を選択する作業は、大変スリリングで楽しかったです。世の中には、目的が明確でない調査アンケートが蔓延し、社会調査を取り巻く環境は決して安穏としていられない情勢ではありますが、こんな私でも少しはお役に立てたかも!と思えた瞬間でした。

2つ目は、言語獲得のモデル化です。私は自分の専門分野として「データ解析」も掲げておりますので、時々、教員や院生などの「データ解析」に関する質問を受けることがあります。ただ、質問に来られた方が満足するような回答をできることは殆んどありません。それは、私が状況を理解するまでに、長い時間が必要であるからです。また、アドバイスするには遅すぎる事もあります。計画的に採られたデータは分析が容易ですが、結果的に分析できない状況で得られたデータを持って来られた場合、なぜ分析が難しいかを説明するのは、大変骨が折れる作業です。

こんな中で、非常に粘り強く説明をして下さり、継続的に励まして下さった方のお陰で、言語獲得の質問紙データの分析に関して、月齢に関する単調性とパーセント点の単調性などの制約条件を満たしつつ、モデル化とパーセント点の推定をすることができました。また、この推定の過程で、副産物として変化点の存在を示唆する結果を得て、1点折れモデルと2点折れモデルによる結果も得ました。

実際の計算としては、折れ点に関するダミー変数を導入することで、通常の回帰分析の計算方法を用いる事が出来て、多くの場合について推定量の算出が簡単に実現できる事が分かりました。現在、この手法は折れ点の前後でデータセットを分割した範囲での回帰分析と同等であることが分っておりますが、データセットの分類と推定量が一致しない場合があり改良を行っております。

3つ目は、院生時代から始まった日本科学技術連盟との関わりです。この連盟は、科学技術省が所轄する財団法人で、日本の科学技術の振興に務めている団体です。そのため、セミナーを行ったり、勉強会を企画したりして企業と大学などの連携も行っています。また、通商産業省の所轄する日本規格協会という団体もあり、これらの繋がりで、この2年間でいくつかの本を書くお手伝いをすることができました。

まず1冊目は「品質管理の入門のお話本」です。同じ大学院出身の先輩がリーダーとなり、セミナーの副読本として作成されました。私はt分布の自由度が である理由を解説する文章を担当しました。2冊目は、「フリーソフトR」についての本です。統計解析ソフトは通常、高機能のものは高額であることが多いのですが「R」はフリーソフトながら十分な機能を持っています。品質管理における「R」の紹介と普及を目指して企画された本です。私は、一部の原稿に意見を述べたに過ぎませんが、先輩から声をかけて頂けたことと共同作業を行ったことで、少し自信を持つ事ができました。

昨年は、これらの経験を踏まえて、私以外が全員企業出身の方々と「品質管理検定の問題集」を作成するプロジェクトに入れて頂きました。このプロジェクトは、品質管理に貢献してきた日本科学技術連盟と日本規格協会が、日本品質管理学会と協力して実施している「品質管理検定」の1級から4級までの問題集を作成しようというプロジェクトでした。私は、比較的理論的な問題を担当しました。この問題集の作成過程で、リーダーの方の納期に対する考え方、他の人が書いた原稿への意見の述べ方、修正方法、これらをまとめていく責任者のあり方まで、大変貴重な勉強をさせて頂きました。

かくして、私の日常は講義とゼミに加えて、上述した沢山の人達の励ましに支えられて、前向きに日々を過ごすことができております。

Updated: 2009/09/17 (Thu) 10:17