瀏覽試卷

113年經濟部聯招-統計學.巨量資料概論

113年經濟部聯招-統計學.巨量資料概論新進職員11360 分鐘50100
試題 1
袋子中有2個紅球、3個黑球、5個白球,每次從袋中抽出1球後放回,共抽3次,請問3球中有 2個是紅球之機率為何?
  1. A0.024
    尚無統計
  2. B0.032
    尚無統計
  3. C0.064
    尚無統計
  4. D0.096
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 2
大學生打工之比例為0.3,若隨機抽取3位大學生,其中至少2位有打工之機率為何?
  1. A0.116
    尚無統計
  2. B0.216
    尚無統計
  3. C0.316
    尚無統計
  4. D0.416
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 3
欲比較兩公司員工薪資之離散程度,可採用下列何者統計量?
  1. A全距
    尚無統計
  2. B平均數
    尚無統計
  3. C變異數
    尚無統計
  4. D變異係數
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 4

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 5

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 6
均方根誤差(RMSE)是藉以衡量下列何者?
  1. A樣本量大小
    尚無統計
  2. B指數平滑度
    尚無統計
  3. C移動平均週期
    尚無統計
  4. D預測的準確性
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 7
下列何種圖表最適合用來顯示資料隨著時間變化之趨勢?
  1. A散點圖
    尚無統計
  2. B長條圖
    尚無統計
  3. C折線圖
    尚無統計
  4. D圓餅圖
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 8

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 9
若右尾檢定的顯著水準(α值)愈小,下列何者正確?
  1. Ap值(p-value)愈大
    尚無統計
  2. B臨界值(Critical Value)愈大
    尚無統計
  3. C樣本平均數愈大
    尚無統計
  4. D母體平均數愈大
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 10
下列何者屬於古典迴歸分析之基本假設?○甲 :誤差項服從常態、○乙 :誤差項彼此不相關、 ○丙 :反應變數 Y 服從常態分配、○丁 :解釋變數間不相關。
  1. A甲、乙
    尚無統計
  2. B甲、丙
    尚無統計
  3. C甲、丁
    尚無統計
  4. D乙、丁
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 11

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 12
若有4家供應商提供原料,欲檢定此4家原料平均數是否相等,可用下列何種檢定?
  1. AF 檢定
    尚無統計
  2. Bt 檢定
    尚無統計
  3. CZ 檢定
    尚無統計
  4. D卡方檢定
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 13
下列何者受離群值(outliers)的影響最小?
  1. A全距
    尚無統計
  2. B標準差
    尚無統計
  3. C變異係數
    尚無統計
  4. D四分位數
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 14
有關迴歸模式(Regression Models)的最小平方估計法(Least Square Estimation),下列敘述何者 正確?
  1. A所求得之迴歸係數,使得依變數之估計值與0的誤差平方和最小
    尚無統計
  2. B所求得之迴歸係數,使得依變數(Y)與其平均數之誤差平方和最小
    尚無統計
  3. C所求得之迴歸係數,使得依變數之估計值與依變數之觀察值的誤差平方和最小
    尚無統計
  4. D所求得之迴歸係數,使得依變數之估計值與依變數之平均數的誤差平方和最小
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 15
某資料分配的偏態係數(Coefficient of Skewness) = -3,請問該資料分配的平均數、中位數與眾 數的順序關係為何?
  1. A平均數=中位數=眾數
    尚無統計
  2. B平均數<中位數<眾數
    尚無統計
  3. C眾數<平均數<中位數
    尚無統計
  4. D平均數<眾數<中位數
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 16
有關信賴區間之敘述,下列何者有誤?
  1. A在變數固定下增加樣本數,區間長度變短
    尚無統計
  2. B在樣本數固定下增加信賴係數,區間長度變長
    尚無統計
  3. C信賴係數是指欲推估參數會落在信賴區間的機率
    尚無統計
  4. D在樣本數固定下增加信賴係數,區間估計的精確度提升
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 17

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 18

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 19
有關 t 分配與常態分配的峰態係數,下列敘述何者正確?
  1. A t 分配的峰態係數比較小
    尚無統計
  2. Bt 分配的峰態係數比較大
    尚無統計
  3. C兩分配的峰態係數一樣大
    尚無統計
  4. D兩分配的峰態係數無法比較
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 20
統計學家證實,要提高抽樣的準確度,最好的方式為下列何者?
  1. A使用速度最快的電腦硬體
    尚無統計
  2. B使用最精準的分析軟體
    尚無統計
  3. C做到隨機抽樣
    尚無統計
  4. D增加樣本數
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 21
假設某隨機變數 X 服從平均數為10的卜瓦松分配(Poisson Distribution),若自其中隨機抽取100 個觀察值構成樣本平均數,請問此統計量服從的抽樣分配為何?
  1. A平均數為10的卜瓦松分配
    尚無統計
  2. B平均數與變異數皆為10的常態分配
    尚無統計
  3. C平均數為10、變異數為1的常態分配
    尚無統計
  4. D平均數為10、變異數為0.1的常態分配
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 22
若樣本資料(4, 6, 6, 8, 10, 14)等6個數值來自於相同的對稱分配,根據此樣本,母體中位數最佳 不偏估計元的數值為何?
  1. A6
    尚無統計
  2. B7
    尚無統計
  3. C8
    尚無統計
  4. D最佳不偏估計元不存在
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 23
檢定母體平均數時,若母體為常態分布且小樣本,下列敘述何者正確?
  1. A母體變異數已知時用Z檢定
    尚無統計
  2. B母體偏離常態時用 t 檢定
    尚無統計
  3. C小樣本時用 t 檢定
    尚無統計
  4. D母體為常態分布用 F 檢定
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 24

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 25

閱讀題文

  1. AA
    尚無統計
  2. BB
    尚無統計
  3. CC
    尚無統計
  4. DD
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 26
有關統計與機器學習的差異,下列敘述何者正確?
  1. A統計是機器學習的一個子領域,兩者沒有明顯差異
    尚無統計
  2. B統計主要用於數據分析,機器學習主要用於模式識別和預測
    尚無統計
  3. C統計強調推論和參數估計,機器學習更側重模式識別和模型訓練
    尚無統計
  4. D統計使用傳統方法進行數據分析,機器學習使用深度學習方法進行模式識別
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 27
下列何者非屬資料前處理(Data Preprocessing)的一環?
  1. A特徵轉換
    尚無統計
  2. B資料分群
    尚無統計
  3. C遺失值填補
    尚無統計
  4. D異常值檢測與排除
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 28
何謂結構化資料(Structured Data)?
  1. A由感測器產生的資料
    尚無統計
  2. B社群媒體上的使用者互動資料
    尚無統計
  3. C具固定格式,如表格資料
    尚無統計
  4. D無固定格式,如文字、影像
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 29
下列何者非屬低品質的資料?
  1. A重複值
    尚無統計
  2. B離群值
    尚無統計
  3. C錯誤
    尚無統計
  4. D雜訊
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 30
下列何者非屬分群的應用範圍?
  1. A垃圾郵件過濾
    尚無統計
  2. B異常檢測
    尚無統計
  3. C顧客細分
    尚無統計
  4. D降維技術
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 31
下列何者非屬離群值的處理方式?
  1. A直接刪除
    尚無統計
  2. B群集分析
    尚無統計
  3. C使用屬性絕對值
    尚無統計
  4. D用其他數值替換,將資料範圍正規化
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 32
. Spark 的 DAG(Directed Acyclic Graph)在資料處理之作用,下列何者正確?
  1. A定義資料內部的儲存結構
    尚無統計
  2. B定義資料處理的邏輯流程
    尚無統計
  3. C定義資料判斷的決策規則
    尚無統計
  4. D定義資料外部的呈現形式
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 33
下列何者非屬群集分析(Clustering Analysis)的 4 個主要階段?
  1. A資料準備與特徵選取
    尚無統計
  2. B相似度計算
    尚無統計
  3. C非線性分類
    尚無統計
  4. D分群演算法
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 34
有關巨量資料的長尾效應(Long Tail Effect),下列敘述何者正確?
  1. A資料量越大,價值就越大
    尚無統計
  2. B少數資料佔據大部分的價值
    尚無統計
  3. C資料的價值會隨著時間推移而衰減
    尚無統計
  4. D大量資料中隱藏著小眾但有價值的資訊
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 35
在資料分群中,用以確定最佳聚類數量的技術為何?
  1. AElbow Method
    尚無統計
  2. BGradient Descent
    尚無統計
  3. C Principal Component Analysis
    尚無統計
  4. DRandom Forest
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 36
何謂遷移學習(Transfer Learning)?
  1. A在不同的環境中部署模型的過程
    尚無統計
  2. B在訓練模型中將資料轉移到不同存儲位置的過程
    尚無統計
  3. C將模型從一個硬體平台轉移到另一個硬體平台的過程
    尚無統計
  4. D在不同的機器學習任務之間轉移模型權重和知識的過程
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 37
Apache Spark 在巨量資料環境中的主要用途為何?
  1. A資料清理
    尚無統計
  2. B即時與批次處理
    尚無統計
  3. C機器學習模型訓練
    尚無統計
  4. D資料視覺化
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 38
何謂交叉驗證(Cross-Validation)?
  1. A將資料集隨機分為訓練集和測試集
    尚無統計
  2. B將資料集按照特徵分為訓練集和測試集
    尚無統計
  3. C將資料集按照時間順序分為訓練集和測試集
    尚無統計
  4. D將資料集多次隨機分為訓練集和測試集,取平均結果
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 39
有關自然語言處理(NLP)之步驟,下列何者正確?
  1. A斷詞→詞性標記→相依剖析
    尚無統計
  2. B斷詞→相依剖析→詞性標記
    尚無統計
  3. C相依剖析→詞性標記→斷詞
    尚無統計
  4. D相依剖析→斷詞→詞性標記
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 40
在機器學習演算法中,下列何者最能避免過度配適(Overfitting)?
  1. A決策樹
    尚無統計
  2. B隨機森林
    尚無統計
  3. C羅吉斯迴歸
    尚無統計
  4. DK-means演算法
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 41
在Hadoop中,HDFS的資料冗餘機制為何?
  1. A資料壓縮
    尚無統計
  2. B資料複製
    尚無統計
  3. C資料分片
    尚無統計
  4. D資料加密
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 42
假設使用半導體晶圓資料,良率資料之反應值以二元類別表示,請問上述情境最適合使用何 種分析技巧?
  1. A羅吉斯迴歸
    尚無統計
  2. B決策樹
    尚無統計
  3. C階層式聚類分析
    尚無統計
  4. D主成分分析
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 43
在資料進行機器學習的過程中,正規化(Regularization)係指下列何者?
  1. A一種降低資料維度的技術
    尚無統計
  2. B一種平衡類別分佈的方法
    尚無統計
  3. C一種改善模型可解釋性的方式
    尚無統計
  4. D一種透過在損失函數中添加懲罰防止過度配適的技術
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 44
下列何種機器學習技術適合偵測大型資料集中的異常值(Anomalies)?
  1. A Apriori演算法
    尚無統計
  2. B隔離森林(Isolation Forest)
    尚無統計
  3. C線性迴歸(Linear Regression)
    尚無統計
  4. D神經網路(Neural Networks)
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 45
下列何種神經網路架構最適合分析序列資料,如時間序列或自然語言?
  1. A生成對抗網路(GAN)
    尚無統計
  2. B卷積神經網路(CNN)
    尚無統計
  3. C前饋神經網路(FNN)
    尚無統計
  4. D循環神經網路(RNN)
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 46
下列何者為使用機器學習時須注意之事項?
  1. A確保模型訓練時間足夠長
    尚無統計
  2. B模型的複雜度越高越好
    尚無統計
  3. C需要有過去資料且資料充足
    尚無統計
  4. D模型的性能與模型的可解釋性無關
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 47
有關支持向量機(Support Vector Machine)中的「核技巧」(Kernel Trick),其作用為下列何者?
  1. A處理高維資料
    尚無統計
  2. B減少支持向量的數量
    尚無統計
  3. C提高支持向量機的計算速度
    尚無統計
  4. D將非線性可分的資料轉換為線性可分的資料
    尚無統計

正確答案

D

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 48
在 ETL 過程中,Transform 主要功能是將抽取之資料進行轉換,下列何者非屬其主要任務?
  1. A資料格式轉換
    尚無統計
  2. B資料清洗
    尚無統計
  3. C資料備份
    尚無統計
  4. D資料聚合
    尚無統計

正確答案

C

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 49
生成對抗網路(GAN)較常應用在下列何種技術上?
  1. A影像生成
    尚無統計
  2. B語音識別
    尚無統計
  3. C文字分類
    尚無統計
  4. D物體檢測
    尚無統計

正確答案

A

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區

試題 50
下列何種技術可實現即時分析?
  1. AOLAP
    尚無統計
  2. B串流處理
    尚無統計
  3. C批次處理
    尚無統計
  4. D資料倉儲
    尚無統計

正確答案

B

難度分析

中等難度 3/5

統計

尚無資料0 次作答

試題內容有誤?

回報會送到後台審核,不會公開在評論區。

評論區