データフェスト2017報告

datafest
| 本ページについて | 開催概要 | イベントの特徴 | 解析に使用したデータについて | レクチャー | 写真 |

本ページについて/データフェストについて

このページでは、2017年3月13日~14日にかけて開催されたデータフェストについて報告しております。データフェストは、2017年より慶應義塾大学の学部生を対象として開始されたデータ解析コンペティションです。

近年、データを解析するコンペティションは様々な団体が主催しており、大いに盛り上がりを見せておりますが、その一方でそれらのコンペティションの対象者は、データ解析をすでに行った経験のある人であり、未経験者や、授業で触れた程度の学生には参加ハードルが高いというのも事実です。

このイベントは、統計を少し勉強し始めた学生と、授業で扱ったことがある学生を対象として、生のデータに触れる機会を提供するとともに、触れる経験を通して、データ解析の種々の手法をどのように現実の問題へ適用すれば良いのかという点について少しでも理解を深めてほしいということで開始いたしました。

また、多くのデータ解析のイベントが2ヶ月~6ヶ月という長期間の解析を要求する中で、私たちはなるべく短期間でこれらの機会を提供することを目指し、2日間という短い期間の中で実施し、参加ハードルを下げることにも取り組みました。

本年度のイベントには、15名の方(申し込み24名)が参加してくださり、イベントを大いに盛り上げてくれました。2日間という短期間の中ではありましたが、様々な視点からの解析が行われました。また、参加者から「データに触れて解析することの楽しみがわかった」という声もいただきました。

最後に、本イベントに協力してくださいました関係者並びに、参加者の皆様にこの場を持って御礼を申し上げます。

開催概要

2017年のデータフェストは以下の日程で開催いたしました。

  1. 日時:3月13日(月)10:00〜3月14日(火)19:00
  2. 会場:慶應義塾大学理工学部矢上キャンパス14棟631A/B教室
  3. 参加資格:慶應義塾大学の学部生(1~4年生).統計学を講義や本などで勉強したことがある方が望ましい.
  4. 参加締め切り:2017年1月30日〜2017年3月1日18:59
  5. 参加費:無料
  6. 参加方式:個人またはグループのいずれか.チームの場合は3人1組での応募をお願いします.
  7. 主催:慶應義塾大学理工学部数理科学科
  8. 共催:国立研究開発法人科学技術振興機構リサーチコンプレックス推進プログラム/殿町ウェルビーイングイノベーションスクール(殿町WiSH)
  9. 共催:慶應義塾大学理工学部管理工学科

イベントの特徴

本イベントには,以下の3つの特徴があります.

初心者に優しい!そして短期間!

データ解析のイベントには,長期間にわたって開催されるものや,データを解析して結果を報告してくださいという形式があります.そういうイベントはデータを解析した経験がある人には参加しやすいですが,まだ統計学を勉強しはじめた人にはなかなかハードルが高くいきなり取り組めないこともあると思います.
一方でこのイベントは,たったの2日間という短期間で開催されますので,長期間時間を取る必要はありません.さらに,データの解析の経験があまりない方を対象としていますので,データの解析について1から丁寧なレクチャーを通して学ぶことができます.実際の解析では,わからないところはその場でアシスタントに聞くことができますので,疑問をすぐに解消できます..

データの解析について1から学べます

データを解析するためには,(1)データの取得の方法,(2)データを加工・整形する方法,(3)データを図示したり,集計して概観する方法などなど,たくさんの方法を知っておく必要があります.これらを1から一人で勉強するためにはとても時間がかかりますし,何が大事で,何が大事ではないのかも見当がつきづらいと思います.
このイベントでは,データを解析するために最低限知っておいたほうが良いことをまとめて,1つずつ丁寧なレクチャーを行いますので,レクチャーを聞いていただくだけでデータの解析の大まかな枠組み,さらに重要な点を身につけることができます.さらに,イベント内では実際の解析で陥りやすいポイントなどについても説明する予定です!

解析をアシスタントがサポートします!

データを解析するやり方がわかっても,解析して明らかにしたいことが違っていれば,やり方だってかわります.このイベントでは,解析していて疑問が出てきたことをすぐに解決できるように,イベント中は解析のアシスタントがいます.ソフトウェアの使い方から,解析の中で「こんなことがしたい,けどどうやればいいんだろう?」という疑問まで,1つ1つ丁寧に一緒に解決します!

解析に使用したデータについて

OLYMPUS DIGITAL CAMERA

今回のイベントでは、PRONTO(シアトルのシェアバイク)のデータの解析を行いました。PRONTOはシアトルにおいて展開されているバイクシェアサービスであり、シアトル市内・郊外に設置されたステーションで自転車をレンタルできるサービスです。データには、各地点でどのようなユーザーが借り、どの地点で返したのかが、レンタルごとに記録されており、今回の解析ではこれらの可視化や、傾向の把握に努めました。

レクチャー

R-Tutorial

OLYMPUS DIGITAL CAMERA

R-Tutorialでは、今回のイベントで使用した解析ソフトウェア(言語)であるRの基本的な使用方法について、統計関連研究室の修士2年の大石くん、樫山くんにレクチャーをしていただきました。

データの外観を把握するためのsummary関数の使い方、平均や分散の求め方、データの型、散布図をはじめとする図の書き方、さらに関数の作り方など、解析において必要となる大部分のレクチャーを実施しました。初めてRを利用する人には、ここで基本的な使い方を学んでもらうことができ、一方で授業等での利用経験がある学生には復習となりました。

R-Graphics : ggplot2,ggmapの使い方

OLYMPUS DIGITAL CAMERA

R-Graphicsでは、今回のデータの解析で必要となる地図上での可視化について扱うために、ggplot2とggmapというRのパッケージの利用方法について、統計関連研究室の修士2年の早瀬くん、酒井くんによるレクチャーが行われました。

ggplotやggmapについては、授業等でも扱うことが少ないため、使い方に少々戸惑いも見られたようですが、ハンズオンで手を動かしながらすすめることで、参加者の方は使い方を徐々に自分のものにしていました。

イベントの写真など

お問い合わせ

お問い合わせは,こちらからお願いいたします.