一、k-均值聚類法(k-Means Clustering)是資料探勘常使用之分群(Clustering)方法,請回答下列問題。(10 分,每小題 5 分)【題組】(一)此方法除了須事先設定 k 值外,
三、【表 1】是某一簡化後的信用卡交易紀錄表,請試用 k-近鄰算法( k-Nearest NeighborsAlgriothm, kNN 或稱案例推論法)回答下列問題。(25 分)【題組】(一)請說明
【題組】(二)請寫出【表 1】中各欄位(交易編號除外)分別屬於符號型(Nominal)、次序型(Ordinal)、亦或數值型(Numerical)欄位,以及其適合之相似度(Similarity)計算方
四、【表 2】為某工程的工作計畫,請以頂點工作網路(Activity On Vertex Network)的應用,回答下列問題。(未列出算式不計分)(10 分,每小題 5 分)【題組】(一)請畫出本工
五、試以設計線上英文字典查詢的搜尋法為例,假設其資料分布均勻,請回答下列問題:(15分)【題組】(一)常見之搜尋法中,哪一種最適合應用此搜尋,且搜尋時間最有效率(3 分)?並請說明此搜尋法的時間複雜度
【題組】(二)有一數列:15、1、3、100、50、44、58、46、27、38,如以 50 作為欲搜尋之鍵值,請以上述回答的搜尋法,依序列出於搜尋成功前,各次與鍵值比較的值為何。(未列出算式不計分)
六、【表 3】是某籃球隊 10 位隊員參加 2 場比賽的得分統計表,在考慮平均執行時間的前提下,請以內部排序法中最好的方法,回答下列問題。(25 分)【題組】(一)欲將 2 場比賽各隊員的總得分由小至