<li id="ylugo"><span id="ylugo"><source id="ylugo"></source></span></li>

  • <code id="ylugo"><samp id="ylugo"><i id="ylugo"></i></samp></code><meter id="ylugo"><nav id="ylugo"></nav></meter>
    1. Least Squares Estimation of Spatial Autoregressive Models for Large-Scale Social Networks

      時間:2021-01-05         閱讀:

      光華講壇——社會名流與企業家論壇第5622期

      主題Least Squares Estimation of Spatial Autoregressive Models for Large-Scale Social Networks

      主講人北京大學 王漢生教授

      主持人統計學院 常晉源教授

      時間2021年1月8日(周五)上午10:00-11:00

      直播平臺及會議ID:騰訊會議,840 737 794

      主辦單位:數據科學與商業智能聯合實驗室 統計學院 科研處

      主講人簡介:

      王漢生,北京大學光華管理學院商務統計與經濟計量系,教授,博導,系主任。全國工業統計學教學研究會青年統計學家協會創始會長,美國統計學會(ASA)Fellow,國際統計協會(ISI)Elected Member。先后歷任8個國際學術期刊副主編(Associate Editor)。在國內外各種專業雜志上發表文章100+篇,并合著有英文專著共1本,(合)著中文教材4本。是愛思唯爾中國高被引學者(數學類,2014—2018)。

      在理論研究方面,王漢生教授主要關注變量選擇、數據降維、高維數據分析、以及復雜網絡數據分析等領域。其所有這些研究都是以大規模、復雜、超高維數據分析為核心。相關的應用領域包括但不局限于:中文文本、網絡結構、位置軌跡。在業界實踐方面,其曾擔任博雅立方科技有限公司首席科學家(2009—2015),百分點首席統計學家(2015—現在)。此外,其與量幫科技、考拉征信、彩虹無線、蓬景數字、西門子、三一重工、格靈深瞳、天罡儀表、廣聯達等眾多企業均有聯合研究工作,涉及量化投資、互聯網征信、車聯網、移動設備RTB廣告競價、搜索引擎營銷、電子商務、重裝制造業等多個重要行業。

      內容提要:

      Due to the rapid development of various social networks, the spatial autoregressive (SAR) model is becoming an important tool in social network analysis. However, major bottlenecks remain in analyzing large-scale networks (e.g., Facebook has over 700 million active users), including computational scalability, estimation consistency, and proper network sampling.

      To address these challenges, we propose a novel least squares estimator (LSE) for analyzing large sparse networks based on the SAR model. Computationally, the LSE is linear in the network size, making it scalable to analysis of huge networks. In theory, the LSE is $\sqrt{n}$-consistent and asymptotically normal under certain regularity conditions. A new LSE-based network sampling technique is further developed, which can automatically adjust autocorrelation between sampled and unsampled units and hence guarantee valid statistical inferences. Moreover, we generalize the LSE approach for the classical SAR model to more complex networks associated with multiple sources of social interaction effect. Numerical results for simulated and real data are presented to illustrate performance of the LSE.

      隨著各種社會網絡的迅速發展,空間自回歸(SAR)模型正成為社會網絡分析的重要工具。然而,在分析大規模網絡數據(例如,Facebook有7億多活躍用戶)時,主要的瓶頸仍然存在,包括計算可伸縮性、估計一致性和適當的網絡抽樣。

      為了解決這些問題,本文提出了一種新的最小二乘估計(LSE)來分析基于SAR模型的大型稀疏網絡數據。在計算上,LSE在網絡規模上是線性的,使得它可以擴展到大型網絡數據的分析。理論上,在一定的正則性條件下,LSE是一致漸近正態的。本文提出的新的基于LSE的網絡采樣技術,它可以自動調整采樣單元和未采樣單元之間的自相關關系,從而保證有效的統計推斷。此外,本文將經典SAR模型的LSE方法推廣到具有多個社會交互效應源的復雜網絡中。模擬數據和實際數據分析結果均表明了該方法的有效性。



      亚洲彩票