常態分配的鐘型曲線的圖 统计学是在统计实践的基础上,自17世纪中叶产生并逐步发展起来的一门社会学科。它是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学,被廣泛的應用在各門學科之上,從自然科学和社會科學到人文科學,甚至被用來工商業及政府的情報決策之上。 譬如自一組數據中,可以摘要並且描述這份數據的集中和離散情形,這個用法稱作為描述統計學。另外,觀察者以數據的形態,建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。數理統計學则是討論背後的理論基礎的學科。 目录 1 統計學的歷史 2 統計學的觀念 3 统计学的范畴 4 統計方法 4.1 測量的尺度 4.2 統計技術 5 延伸學科 6 参见 编辑 統計學的歷史 統計學的英语词statistics是源於現代拉丁语statisticum collegium(國會)以及義大利语statista(國民或政治家)。德语Statistik,最早是由Gottfried Achenwall(1749)所使用,代表對國家的資料進行分析的學問,也就是“研究國家的科學”。在十九世紀統計學在廣泛的數據以及資料中探究其意義,並且由John Sinclair引進到英語世界。 因此,統計學的初衷是作為政府(通常是中央政府)以及管理階層的工具。它大量透過國家以及國際統計服務蒐集國家以及本土的資料。另外依照各方面,普查則提供關母體的資訊。 統計背後牽涉到更多數學導向的領域,如機率,或是從經驗科學(特別在天文學)中獲得的經驗證據設定估計參數。在今日的世界裡統計已經被使用在不僅僅是國家或政府的事務,更延伸到商業,自然以及社會科學,醫療等甚至更多方面。 因為統計學擁有深厚的歷史以及廣泛的應用性,統計學通常不只被認為是數學所處理的對象,而是與數學本身的哲學定義與意義有密切的關聯。許多知名的大學擁有獨立的數理統計學系。統計學也在如心理學,教育以及公共衛生學系中被視為是一門主科。 编辑 統計學的觀念 费舍尔鸢尾花数据集之中杂色鸢尾花萼片宽度数据的分布直方图 為了將統計學應用到科學、工業以及社會問題上,我們由研究母群體開始。這可能是一個國家的人民,石頭中的水晶,或者是某家特定工廠所生產的商品。一個母群體甚至可能由許多次同樣的觀察程序所組成;由這種資料蒐集所組成的母群體我們稱它叫時間序列。 為了實際的理由,我們選擇研究母群體的子集代替研究母群體的每一筆資料,這個子集稱做樣本。以某種經驗設計實驗所蒐集的樣本叫做資料。資料是統計分析的對象,並且被用做兩種相關的用途:描述和推論。 描述統計學處理有關敘述的問題:是否可以摘要的說明資料的情形,不論是以數學或是圖片表現,以用來代表母群體的性質?基礎的數學描述包括了平均數和標準差等。圖像的摘要則包含了許多種的表和圖。主要是就說明資料的集中和離散情形。 推論統計學被用來將資料中的數據模型化,計算它的機率並且做出對於母群體的推論。這個推論可能以對/錯問題的答案所呈現(假設檢定),對於數字特徵量的估計(估計),對於未來觀察的預測,關聯性的預測(相關性),或是將關係模型化(迴歸)。其他的模型化技術包括變異數分析(ANOVA),時間序列(time series analysis),以及数据挖掘(data mining)。 相關的觀念特別值得被拿出來討論。對於資料集合的統計分析可能顯示兩個變數(母群體中的兩種性質)傾向於一起變動,好像它們是相連的一樣。舉例來說,對於人收入和死亡年齡的研究期刊可能會發現窮人比起富人平均來說傾向擁有較短的生命。這兩個變數被稱做相關的。但是實際上,我們不能直接推論這兩個變數中有因果關係;參見相關性推論因果關係(邏輯謬誤)。 如果樣本足以代表母群體的,那麼由樣本所做的推論和結論可以被引申到整個母群體之上。最大的問題在於決定樣本是否足以代表整個母群體。統計學提供了許多方法來估計和修正樣本和蒐集資料過程中的隨機性(誤差),如同上面所提到的透過經驗所設計的實驗。參見實驗設計。 要了解隨機性或是機率必須具備基本的數學觀念。數理統計(通常又叫做統計理論)是應用數學的分支,它使用機率論來分析並且驗證統計的理論基礎。 任何統計方法是有效的只有當這個系統或是所討論的母群體滿足方法論的基本假設。誤用統計學可能會導致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫療實踐以及橋樑或是核能發電計畫結構的可靠性。 即使統計學被正確的應用,結果對於不是專家的人來說可能會難以陳述。一些統計科學的結果對於大眾而言相當費解。舉例來說,統計資料中顯著的改變可能是由樣本的隨機變量所導致,但是這個顯著性可能與大眾而言難以理解。另外,某些統計學分析(尤其當涉及概率論時)得出的結論可能非常違悖一般人的直覺,如蒙提霍爾問題。人們(甚至包括一些科學家)往往需要統計的技巧(或懷疑)才能理解其正確性。 编辑 统计学的范畴 概率论与数理统计 抽样与抽样分布 统计数据的搜集、整理与显示 参数估计 非参数估计 假设检验 方差分析 时间序列分析 统计指数 聚类分析与判别分析 主成分分析与因子分析 相关分析与回归分析 编辑 統計方法 编辑 測量的尺度 根據Stevens(1951)對數字的尺度分類,統計學一共有四種測量的尺度或是四種測量的方式。這四種測量(名目,順序,等距,等比)在統計過程中具有不等的實用性 。等比尺度(Ratio measurements)擁有零值及資料間的距離是相等被定義的,等距尺度(Interval measurements)資料間的距離是相等被定義的但是它的零值並非絕對的無而是自行定義的(如智力或溫度的測量)。(Ordinal measurements)順序尺度的意義並非表現在其值而是在其順序之上。名目尺度(Nominal measurements)的測量值則不具量的意義。 编辑 統計技術 以下列出一些有名的統計檢定方法以及可供驗證實驗數據的程序 Student t檢定(Student's t-test)註:Students為發展出此方法原創者的筆名。 變異數分析(ANOVA) 卡方分配(chi-square) 費雪最小顯著差異法(Fisher's Least Significant Difference test) 曼-惠特尼U檢定(Mann-Whitney U) 回歸分析(regression analysis) 相關性(correlation) 皮爾森積矩相關係數(Pearson product-moment correlation coefficient) 史匹曼等級相關係數(Spearman's rank correlation coefficient) 编辑 延伸學科 有些科學廣泛的應用統計的方法使得他們擁有各自的統計術語,這些學科包括: 農業科學 生物統計 商务統計 資料採礦(應用統計學以及圖形從資料中獲取知識) 經濟統計學 電機統計 統計物理學 人口統計 心理統計學 教育統計學 社會統計(包括所有的社會科學) 文獻統計分析 化學與程序分析(所有有關化學的資料分析與化工科學) 運動統計學,特別是棒球以及曲棍球 統計對於商業以及工業是一個基本的關鍵。他被用來了解與測量系統變異性,程序控制,對資料作出結論,並且完成資料取向的決策。在這些領域統計扮演了一個重要的角色。 编辑 参见 统计 Wikipedia:统计 Special:Statistics 统计学家列表 统计学主题列表 统计图形 查 • 論 • 編 統計學 描述統計學 连续概率 集中趋势 平均數(平方、算術、幾何、調和、算术-几何|平均數不等式) · 中位數 · 眾數 离散程度 全距 · 標準差 · 變異係數 · 百分位數 · 四分差 · 四分位数 · 方差 · 標準分數 · 切比雪夫不等式 分布形态 偏態 · 峰態 离散概率 次數 · 列聯表 推論統計學 和 假設檢定 推論統計學 置信区间 · 區間估計 · 顯著性差異 · 元分析 · 貝氏分析 实验设计 统计总量 · 抽样 · 重复 · 阻碍 · 特敏度 · 區集 样本量 统计功效 · 效应值 · 标准误 · 虛無假設 · 對立假設 · 第一型和第二型誤差 · 統計檢定力 常规估计 贝叶斯估计算法 · 區間估計 · 最大似然估計 · 最小距離估計 · 矩量法 · 最大间距 特效检验 Z检验 · 學生t檢驗 · F检验 · 卡方检验 · Wald检验 · 曼-惠特尼检验 · 秩和检验 生存分析 生存函數 · 乘積極限估計量 · 對數秩和檢定 · 失效率 · 危險比例模式 相关及 回归分析 相关性 混淆變項 · 皮爾森積差相關係數 · 等級相關 (史匹曼等級相關係數、肯德等級相關係數) 线性回归 線性模式 · 一般線性模式 · 廣義線性模式 · 方差分析 · 協方差分析 非线性回归 非参数回归模型 · 半参数回归模型 · Logit模型 統計圖形 饼图 · 長條圖 · 雙標圖 · 箱形圖 · 管制圖 · 森林圖 · 直方圖 · QQ圖 · 趋势图 · 散佈圖 · 莖葉圖 查 • 論 • 編 科学技术信息的可视化 领域划分 数据可视化 · 信息可视化 · 知识可视化 · 化学成像 · 罪行绘图 · 教育可视化 · 流场可视化 · 地理可视化 · 数学可视化 · 医学成像 · 分子图形学 · 产品可视化 · 科学可视化 · 软件可视化 · 技术制图 · 立体可视化 图像类型 图表 · 计算机图形学 · 图示 · 函数图 · 工程制图 · 表意文字 · 信息图形 · 地图 · 照片 · 象形文字 · 图 · 统计图形 · 表格 · 技术插图 软件工具 数值分析软件(VisIt · Scilab) · 知识可视化工具(Protégé) 领域专家 Jacques Bertin · Stuart Card · Thomas A. DeFanti · 迈克尔·弗兰德利 · Nigel Holmes · Alan MacEachren · Jock D. Mackinlay · Michael Maltz · Bruce H. McCormick · Charles Joseph Minard · Otto Neurath · William Playfair · Clifford A. Pickover · Arthur H. Robinson · Lawrence J. Rosenblum · Adolphe Quetelet · George G. Robertson · Ben Shneiderman · Edward Tufte 相关主题 制图学 · 计算机图形学 · 图形绘制 · 图形设计 · 影像学 · 信息科学 · 心理可视化 · 神经影像学 · 科学建模 · 空间分析 · 可视化分析论 · 视知觉



http://taihang.hebau.edu.cn/jingpinke/shengji/jiliangjingjixue/jiaoshiff/zyxgrjj.htm

统计推断(英文版·原书第2版)(09年度畅销榜NO.4) - China-Pub网上书店

该书是为统计学方向或者使用概率统计较多的领域的大学生和研究生撰写的有关统计推理的理论、思想、方法的教材。 作者设计为一个学年的教学。 其内 ... 在适应当前统计学从对特例的精致证明转向复杂问题和实际案例的求解方法的国际潮流前提下,兼顾数学的严谨性与统计学的直观性,材料取舍适当。 着重强调计算与模拟,加进了不少近代统计中数据处理的实用方法与思想,例如: ...




http://taihang.hebau.edu.cn/jingpinke/shengji/jiliangjingjixue/jiaoshiff/zyxgrjj.htm

(英文版)商务统计学 - China-Pub网上书店

本书将统计学的概念与方法应用于商务领域,从应用层面对统计学基本方法进行了系统的讲解。 全书包括探索和收集数据、理解数据和分布、探索变量间的关系以及为决策建立模型四部分内容,共24章,将方法的讲解与商务领域中的现实案例紧密结合起来,让读者掌握如何利用统计方法解决商务中的实际问题。 ...



Statistics Concepts and Controversies
http://www.ghy.cn/newstudy/detail.aspx?ID=37566

中国人民大学统计学院

地点:明德主楼1030统计学院讲堂. 摘要. High dimensional regression problems which reveal dynamic behavior are typically analyzed by time propagation of few factors. ...




http://www.xznbook.com/products.asp?id=3090

生物谷--生物软件--统计学软件

联数软件:算是最实用的统计学网站了,大量统计软件等着您!似乎是个人站点,不错,值得留连的地方!强力推荐! 医学统计之星 中文专业统计学站点,致力于统计软件的教学和普及统计学知识:免费提供SAS、SPSS、Stata等的入门教程,是几个专业统计老师办的,非常好,大概从99年便开始了吧,可谓历史悠久了。 ...




http://www.douban.com/subject/1138353

华章图书 - 概率统计(英文版)

本书是以作者在加利福尼亚大学伯克利分校统计学系给高年级本科生和研究生授课的教学讲义为基础写成的,前半部分为概率,后半部分为统计。 ... Charles J.Stone,斯坦福大学统计学博士,现为加利福尼亚大学伯克利分校统计系教授,主要研究方向是非参数统计模型、统计软件。 The writing of this ...




http://www.buy-book.net.cn/shihuikexue/16232.html

26541

人口统计学研究——目的. 一些方法,利用它们流行病学家们可以从发病率和死亡率的角度评价人群的健康状态. 廉价的,病因假说的第一手检测. 可以通过使用容易得到的重要健康数据来实施. 全美人口统计学数据来源. 全美人口统计学数据来源. 美国全国普查. 国家卫生统计中心(疾病控制预防中心,CDC) 疾病控制预防中心. 死亡统计办公室和报告. 劳动统计局 ...



3 4
http://jingpin.sgg.whu.edu.cn/dqxb/sb/kcms-5.htm

中国人民大学统计学院

明德主楼1030(统计学院讲堂) 报告摘要: The nonlife insurance industry operates in an environment of continual change. Change in laws and regulations, the competitive ...




http://www.jiushu8.com/Sale/347761.aspx

统计之都 (cos_name) on Twitter

中国统计学门户网站,免费统计学服务平台 ... 邱怡轩: 第三届中国R语言会议(上海会场)纪要 | 统计之都 (中国统计学门户网站,免费统计学服务平台) http://cos.name/2010/11/3rd-china-r-shanghai-summary/ 11:59 AM Nov 22nd via web ...




http://www.golden-book.com/booksinfo/17/172590.html

Cheng&Meiling

无奈的统计学. May 27th, 2011. 看到这样一则新闻:根据统计局公布的2010年国民经济核算中对居民消费支出的统计结果,月均1123元得支出中占比最多的前四位分别是食品类月支出400元,交通和通信类支出165元,教育娱乐服务类支出136元以及衣着类支出120元。 而每月住房支出仅为111元,排在衣食住行的末位。 ...




http://sw.gzife.edu.cn/shuxueyutongji/Html/news/20090612092004832.html