臺大特色課程系列報導--管理學院工商管理學系及資訊管理學系 合辦「大數據與商業分析」跨領域課程

「大數據」(Big Data)一詞自2011年起逐漸浮現在商業大眾的視野,相關書籍與論述如雨後春筍般湧出,各行各業都對此一名詞充滿期待,而「對大數據分析與應用有基本的認知」也成了企業徵才的新條件。為協助同學建立大數據的相關知識與能力,強化其未來在各領域的競爭力,我們特別針對臺大管理學院的同學策劃此一跨系課程,透過講演與專案,概念與實作並重,有系統的介紹數據分析在商管領域的相關應用。

大數據這個名詞大致上可以對應到三個區塊:大數據基礎設施、大數據分析、大數據應用。大數據基礎設施主要是要解決大量資料的收集、儲存、管理等問題所發展的軟體系統,著名的專案如Hadoop與Spark是這個區塊的代表。雖然這個區塊常被認為”就是”大數據,但在課程的規劃上我們對基礎設施僅是概念性的討論,並將主要的時間分配給大數據分析與應用,希望讓學生在有限的時間內,由上而下,對大數據相關概念與商業應用有完整的理解。

課程的內容由大數據的應用開始,介紹不同產業,如運動、金融、工業生產等,如何透過數據的收集與分析向上提升;爾後討論如何在”數據大海”中航行,連結決策與整個數據收集、清理、加總、分析流程,設法循環而上,找出清晰的輪廓,並對症下藥。大觀念建立之後,進一步深入探討管理中常見的應用,如行銷與顧客關係管理中更細緻的資料分析議題。課程亦涵蓋一些資料分析工具與方法的介紹,如各種分類器與迴歸方法,並強調模型訓練、校正與測試的標準程序,以及預測能力的衡量與評估。課程的最後一個模組介紹文字資料與社群資料的分析與應用。解析如何處理文字資料,將之轉換成適當的資料表示法,協助學生瞭解文字資料的分類與分群問題,並以一些著名的社會事件(如名人的外遇事件)為例,介紹情感分析與輿情追蹤的各項應用。最後介紹中文文字探勘,輔以臺北1999市民熱線資料分析報告實例,希望學生能對典型的資料分析流程有清晰地認知。

本跨領域課程獲得管理學院郭瑞祥院長與各系系主任的大力支持,由工商管理學系黃俊堯教授、資訊管理學系盧信銘副教授及工商管理學系楊立偉兼任助理教授合授。管理學院的同學們亦意識到Big Data的重要性,初選十分踴躍。為平衡各系學生分布,管院五系設有保障名額,剩餘名額由抽籤決定;期中與期末報告以混系的方式,5~6人為一組,進行分組討論及撰寫團隊報告。跨系所的組成讓同學們在小組報告的發想、討論、分析的工作過程中,了解不同訓練背景的特性,相互交流以擴大視野、激發新的想法。

本課程的期中與期末報告,分別針對信用卡市場動態與股票市場動態進行分析。兩個議題的設計,目的是希望同學可以透過動手做的過程,實際演練資料分析的步驟,並且對 “異質資料”的整合,能有第一手的經驗。由於課程以資料的分析與應用為主,兩次報告所用到的資料由授課教師統一提供。信用卡動態使用金管會銀行局之信用卡重要業務及財務資訊揭露,與一年的相關信用卡線上討論與報導,了解市場動態、競爭關係、與線上報導及討論的影響。第二個報告利用股市日資料,搭配社群媒體與新聞對個股的討論,分析股市動態、特性與線上報導,以及討論數據和個股走勢的關聯。這兩個報告都使用到結構性的數字資料與非結構性的文字資料,可以讓同學們充分體會在大數據時代跨資料來源的整合與分析的課題。

跨領域課程是否成功,難以用分數評斷,但授課團隊驚喜發現,同學們都有不屈不撓的精神,針對報告主題奮戰不懈,並在報告中展現令人讚賞的分析結果。這個課程從無到有,期待在同學的心中建立良好、正確的資料分析概念,讓資料分析成為管理人才口袋中的瑞士刀。