学术论文
以下是我在计量经济学、贝叶斯统计和大数据算法领域的主要研究成果。为了方便快速浏览,每篇论文附上了通俗易懂的中文总结,并提供了原文的下载链接。
Maximum Likelihood Estimation of Regression Effects in State Space Models
通俗总结: 状态空间模型中通常很难同时估算回归系数和隐藏状态。本文提出了一种新方法,巧妙结合了经典的卡尔曼滤波和最大似然估计,能在不增加计算复杂度的前提下,得到精确的参数估算结果。
Bayesian Estimation of Fixed Effects Models with Large Datasets
通俗总结: 在处理海量数据的固定效应模型时,传统的“引入虚拟变量”法容易导致电脑内存溢出。本文提出了一种基于贝叶斯抽样的新算法,能够绕开虚拟变量直接进行估算,彻底解决了复杂模型的内存负担问题。
Divide-and-conquer Metropolis–Hastings samplers with matched samples
通俗总结: 面对庞大的数据集,传统的贝叶斯分析往往计算极其缓慢。本文设计了一种“分而治之”的算法,先将大数据拆分成小块分别计算,再通过一种巧妙的“样本匹配”技术将结果无损合并,从而大幅提升了计算效率。
Bayesian Inference in Common Microeconometric Models With Massive Datasets by Double Marginalized Subsampling
通俗总结: 为了加速海量微观经济数据的分析,本文开发了一种“双重边缘化子抽样”技术。这种方法让计算机在每次迭代时只需评估极少的数据点,就能精准还原整体数据的特征,极大地提升了处理大规模数据的速度。
Estimating MIDAS regressions via OLS with polynomial parameter profiling
通俗总结: 在处理不同频率(如月度和季度)的混合数据回归时,传统方法往往需要复杂的非线性计算。本文提出了一种结合普通最小二乘法(OLS)和多项式参数分析的新框架,让这类混合频率数据的分析变得更加简单和稳定。
Big Data Bayesian Linear Regression and Variable Selection by Normal-Inverse-Gamma Summation
通俗总结: 本文将复杂的贝叶斯大数据分析转化为了简单的“加法”运算。通过引入一种新的求和算子,算法可以将不同数据源的计算结果直接拼合,为超大规模数据的变量筛选和线性回归提供了一种极其高效的解决方案。
Inequality Constrained State Space Models
通俗总结: 经典的卡尔曼滤波在面对带有“不等式约束”(比如变量取值必须大于零)的数据时往往会失效。本文引入了一种优化的粒子滤波算法,能够在这种复杂的约束条件下依然准确地追踪和估算隐藏的数据状态。
The effects of exports on facility environmental performance: Evidence from a matching approach
通俗总结: 出口企业是否一定比非出口企业更环保?本文利用美国制造业的数据研究发现,这种“出口带来的环保效应”并非绝对,而是高度依赖于企业所在行业的具体特征(如治污成本和资本密集度)。
A computationally efficient method for vector autoregression with mixed frequency data
通俗总结: 宏观经济数据往往存在频率不一的问题(如月度数据与季度数据混杂)。本文提出了一种计算高效的贝叶斯向量自回归(VAR)方法,能够在保留经济学直觉的同时,直接融合并处理这些不同频率的数据。
Income distribution in urban China: An overlooked data inconsistency issue
通俗总结: 本文指出,2002年中国城镇住户调查样本的扩大(纳入了流动人口)导致了前后数据的结构性断层。研究利用动态模型还原了一个连贯的时间序列,为准确衡量中国城市收入分配(如计算基尼系数)提供了更可靠的数据基础。
A FLEXIBLE STATE SPACE MODEL AND ITS APPLICATIONS
通俗总结: 传统的模型通常将观测到的数据和未知的隐藏状态区别对待。本文提出了一种全新的“灵活状态空间模型”,将两者对称处理,使得在分析动态因子或波动率等问题时,模型结构变得更加直观和精简。