跳到主要内容

偏离典型路径:行为科学中使用GPS数据的一种新方法

摘要

背景

行为科学研究人员越来越多地收集详细的位置数据,例如对参与者的秒秒GPS跟踪,因为越来越容易和负担得起。虽然几十年来旅行文献一直在讨论个体内部的变异性,但设计用于研究集中倾向的个体差异的传统方法限制了关于生活经验变异性的新问题的回答程度。因此,需要量化行为的新方法,关注个体内部的可变性,以解决行为发生的环境和行为派生的位置跟踪数据。

方法

我们建议将偏离典型路径作为一种数据处理技术,从位置跟踪数据集中分离出个人层面的典型旅行行为,以突出非典型旅行行为作为结果测量。

结果

一个模拟数据示例展示了该方法如何从位置数据集产生偏差测量。与传统的每日离家最大距离测量相比,对这些偏差的分析提供了更多的见解。

结论

这个过程可以整合到更大的研究问题中,以探索非典型行为的预测因素和行为改变的潜在机制。

背景

全球定位系统(GPS)和类似的位置跟踪技术可以收集有关旅行行为的丰富数据。在过去的十年中,人们对使用位置跟踪提供的详细数据来回答行为科学中涉及个人日常居住的物理环境的研究问题越来越感兴趣。特别是活动空间和生活空间这两个研究领域可能会受益于这种自动和不引人注目的数据收集。例如,表示个人在日常生活中占据的空间的概念,如生活空间或活动空间,在历史上是使用自我报告来测量的,但现在可以使用位置跟踪数据来测量[1].虽然已经从位置数据中得出了各种各样的指标,但目前使用的这些指标可能在代表生活空间的全部概念方面受到限制[2].

生活空间和活动空间研究,就像交通研究一样,经常将连续许多天的测量数据总结为少量的代表性值,以接近更细粒度的旅行测量的趋势[3.456].此类测量的例子包括每天离家的最大直线距离的平均值或个人在日常生活中占用的平均空间面积。虽然人们普遍认为旅行行为的个体差异[789],研究的重点主要是在测试集中趋势的个体差异时,使用多天的数据来获得更稳定的估计。在这些情况下,个体行为规范的变化被认为是错误。然而,关于个体内部变异的研究问题为生活空间和旅行行为的新见解提供了机会。例如,对几天内通勤路线数量的个体差异的研究表明,流动性研究人员对旅行行为的个体内部变化感兴趣[10].由于已经收集了多天的数据来测量中心倾向,人们可以使用这些数据直接回答关于个体内部变异性和非典型行为的新问题。

这种个体内部的可变性——人的行为的日常可变性——使研究人员有机会回答关于旅行行为和健康的新问题。这些新问题可以将健康体验的日常变化与当天行为的变化联系起来,并允许这些关联的大小在个人层面的特征上有所不同。例如,我们预计生活空间不仅在更虚弱的老年人中更小[11],而是在老年人报告的身体症状较多的日子里动态收缩。此外,有证据表明,生理储备减少的人对其直接环境中的扰动更敏感。12],我们预计这种生活空间和身体症状的动态耦合在体弱的老年人中会更强。除了将某一天的经历与当天的旅行行为联系起来之外,旅行行为的个体内部变异程度本身可能与健康结果有关。从动态系统的角度来看,系统会随着人的变化(如健康、知识或能力的变化)、环境(如交通模式的变化或道路封闭)或情况(如新需求,如新工作或全球大流行)的变化而波动。[13].例如,关于每天花在户外活动上的时间的可变性的研究表明,非工作活动通常会发生,但在许多天内花费的时间没有单一的典型量。14].旅行行为的个体内部变异可以将这些活动建模为与典型的以工作为中心的行为的偏差,从而进一步探索与个人其他行为或特征的关联。此外,考虑到交通行为的日常变化程度,可以为我们理解乘客细分和服务定制提供额外的见解[15].

在个体内部变异和共变异的框架中利用详细的多日研究的潜力的障碍是,当前的度量标准与面向个体内部变异的研究问题不一致。例如,在生活空间和流动性研究中常用的每日离家最大距离[3.111617181920.21],在不同的日子里可能是相等的,但这些天的路线有很大的不同。这种方法上的人为因素可能掩盖了将某一天的体验与当天的旅行行为联系起来的个体内部动态,以及旅行行为日常变化程度的个体间差异。之前的工作已经根据经常访问的地点确定了个体的周期性行为[2223]以及基于日常行为模式的个体之间的相似性[23].然而,这些方法并不能直接解决非典型行为或路径可变性。现有的关于路线转换行为的综合测量的研究评估了个体使用各种路线的频率,但没有提取关于个体内部变化的额外特征,以用于进一步分析[1024].同样,对离家距离的常用测量掩盖了行为的广度,例如在离家一定距离内发生的临时旅行和短途旅行,从而阻止了对这种旅行的可变性和动机的进一步研究。

在本文中,我们概述了一个计算典型路径距离的一般框架,可用于研究基于位置跟踪数据的旅行行为的个体变异。这些措施可用于进一步分析,以回答有关旅行行为的动态以及这些动态对目标结果的影响的问题。这个框架提供了一个灵活的框架,以适应特定的研究问题,偏离个人层面的典型旅行行为。虽然已从全球定位系统和其他位置跟踪数据中得出了各种测量方法[2],我们的方法是新颖的(据我们所知),因为它关注的是异常测量,而这些异常测量在传统上被解释为模型中的噪声或误差,作为主要兴趣的测量。在本文的其余部分,我们将描述如何利用现有的路径估计程序来提供一个单独的参考路由集,从中可以计算偏差。这些偏差可以根据频率或幅度进行量化,直接纳入标准分析框架,如回归模型,以解决与旅行行为可变性有关的行为问题。

我们从实现该框架的逐步指南开始,包括估计个人典型路径和计算偏离该路径的两阶段过程。该框架允许对具体研究问题的方法进行实质性修改。下面是一个模拟数据的示例,演示如何应用和修改这个框架。通过这个例子,我们将我们的方法与常见的离家距离技术进行比较,以说明我们偏离典型路径技术的效用,以捕捉旅行行为的日常变化。此外,我们还提供了将所提出的路径估计技术应用于实际数据的演示。最后,我们讨论了该框架的实用性以及该领域未来应用和发展的可能方向。

方法

我们概述了一个包含六个步骤的框架,如表所示1.这些步骤适用于初级和次级数据分析。前三个步骤通常发生在数据收集之前,涉及形式化问题、定义和假设,包括:(1)建立研究问题,(2)建立理论并形式化假设,以及(3)将目标动态化并确定数据的先验分组。后三个步骤代表了我们的主要贡献,并概述了收集位置跟踪数据后分析数据的过程:(4)定义和确定典型路径,(5)计算偏差,最后(6)分析偏差。下面将按顺序详细描述每个步骤。

表1偏离典型路径框架的步骤

形式化问题、定义和假设

建立一个研究问题

在估计典型路径和计算偏差之前,我们必须首先建立一个研究问题,定义我们试图捕捉的典型旅行行为和研究这种典型行为偏差的目的。例如,研究人员必须决定,这项研究的目的是检查变异性大小的个体差异,典型路径的代表性,还是某一天过境行为与当天经历的关联。研究人员还必须考虑重点是时间变异性、空间变异性,还是两者兼而有之。所选择的研究问题必须与所使用的数据一致。例如,关注日常出行行为的个人内部可变性的问题将需要多天的数据来解决。研究问题在选择适当的路径估计程序、偏差的量化和分析方面也很关键。

建立理论,形式化旅行行为的目标动力学假设

第二步是建立适当的理论来描述所考虑的行为动力学。理论在这一过程中至关重要,因为它将研究导向旅行行为的时间动态,这对涉及数据收集和处理的决策至关重要。例如,在数据处理开始之前,研究人员必须确定行为展开的时间尺度(秒、分、小时、天、周)及其重复周期(小时、天、周)。研究人员可能会意识到行为是在嵌套的时间尺度上展开的,比如在一天内嵌套的瞬间行为,在一周中的某一天嵌套的行为,在一个季节里嵌套的行为。此外,研究人员必须参考或发展一种理论,以确定是否也预期有意义的增长过程(例如,在研究期间生活空间的缩小或扩大或旅行行为)。例如,离开既定地点或路线的旅行增加可能反映了旅行的灵活性或自由度的增长,也可能表明对获取当前可访问的建成环境无法随时提供的资源的需求增加[25].理论还可以确定目标运动行为的动力学是否允许典型路径的存在。例如,一些研究人员提出,没有一天是典型的非通勤旅行[14但也许将通勤旅行建模为典型行为可以为非通勤旅行提供有意义的背景,从而获得新的见解。在已经收集数据的情况下,探索性分析或相应的定性报告可能为建立内在动力提供灵感。

由于我们技术的灵活性,在估计典型路径和偏差之前,必须考虑旅行行为的动力学。这将有助于定义哪些控制和约束是必要的,以发现旅行行为中的信息性偏差。例如,工作之余的午餐行程算不算值得研究的偏离?普通出行行为的改变,比如在加油站停车,是有意义的偏离吗?路线改变,例如交通绕道,是否值得关注?在可能的情况下,在数据收集之前建立这些分析目标,允许研究人员向参与者询问这些关键时间或地点,以方便数据处理。无论是哪种方式,明确目标运动行为的动力学定义都可以提高估计路径的精度,从而提高偏差估计。

动态操作目标并确定数据的先验分组

既然已经建立了理论框架,就可以做出数据处理决策来组织数据,使其与目标动态一致。与建立理论类似,在可能的情况下,最好在数据收集之前做出这些决定。但是,可以在数据收集之后进行调整,以适应数据中未预料到的行为。首先,研究人员需要决定如何根据预期的旅行行为对观察结果进行最佳分组。将为每组观测估计一个典型路径,这意味着这些组应该反映共享的旅行行为。典型路径应该有一个确定的范围,基于开始和结束位置、一天中的时间,或者两者兼而有之。因此,这些分组在观察到的时间序列中定义了可识别和可重复的行为。

我们注意到路径的持续时间在不同的研究中可能不同。例如,一整天的路径被认为与生活空间相关,但对通勤模式的研究可能侧重于上下班的不同通勤。在一项研究中,每个人可能存在多个典型路径,例如工作日路径和周末路径。根据研究的不同,这些分类可以在数据处理之前作为上下文或假设驱动建立,也可以在处理和分析期间作为数据驱动分组进行探索。在这篇论文中,我们将关注一个先验建立的分组。例如,关于以通勤为导向的旅行的研究应确定个人通勤的日期。鉴于在家工作的选择越来越多,可能需要更长的数据收集时间来确定通勤不太频繁的人的典型路径。类似地,需要前往多个工作场所的个人将需要按工作场所进行通勤分组。

其次,在观测数据分组之后,需要对数据进行组织,以反映理论,并与统计软件中的路径估计程序保持一致。在大多数情况下都需要长格式,其中每个观察到的位置都是一个单独的行。如果存在单独的分组,如工作日和周末,并对应于单独的要估计的典型路径,则每个组的观测值应保存在单独的数据集中或具有明确标签的单个数据集中,可用于在路径估计之前进行子集设置,并在计算偏差时再次为适当的典型路径分配点。

一旦这些关于研究目标和数据处理的步骤完成,获取典型路径和数据偏差的程序就可以开始了。剩下的分析步骤,包括技术细节和修改,将在下面的章节中描述。由于这些步骤代表了本文的主要贡献,因此每个步骤都分配了自己的部分。

定义和确定典型路径

该框架的第四步是定义和确定典型路径。对于我们的目的,路径是单位间隔到由纬度和经度坐标定义的二维空间的连续映射,也称为平面曲线。典型路径的存在是我们的框架的一个关键假设,之前的步骤导致将观察组织到组中,必须建立一个典型路径被认为存在的组。每组观测值都对应于一条估计路径。这个定义可以扩展到包括时间的三维空间,如果时间上的偏差是主要的或额外的兴趣。或者,时间戳可用于定义分析中的分组和协变量,而不是在路径估计期间用作第三维。路径的特定特征可以在定义和估计过程中进行编码。例如,具有相同起点和终点的封闭路径允许将全天视为分组,因为我们可以假设每个人每天的开始和结束都在一个共同的位置或旅行。如上所述,观测位置点的其他分组是可能的,例如关注上班的通勤。在这种情况下,我们将拟合一条与数据不封闭的曲线,已知家庭的起点和工作的终点。 Assumptions such as limiting travel to known roads are possible to incorporate via alternative path estimation techniques such as map-matching, lending face validity to the estimated path. It is also possible to replace the estimated continuous path in this framework with a dense set of discrete ordered or unordered points defined as latitude, longitude pairs representing all geographic locations that the individual passes through as part of their route.

确定典型路径的过程可以通过许多不同的方式来完成,这取决于研究的设计和数据收集。下面,我们将主要曲线描述为数据驱动选项,然后简要说明自我报告的典型路径的使用。我们还提供潜在的调整,以考虑研究设计和研究目标。在这个模块化框架中,可以替代估计典型路径的替代方法。

数据驱动的典型路径-主要曲线和变化

估计路径本质上是通过数据拟合一条没有间隙或不连续的曲线。如果需要估计多个典型路径,则该过程应该针对每个分组分别完成——例如,应该从不同的数据集分别估计工作日和周末的典型路径。有几种方法可以将曲线拟合到位置数据,以产生估计的旅行路径,其中大多数在统计文献中被认为是平滑程序。我们建议选择基于匹配数据的已知属性与程序的假设平滑过程。例如,当已知旅行仅限于道路时,可以采取额外的步骤将估计的典型路径限制在已知的道路上。在本文中,我们主要关注使用主曲线来估计典型路径,原因有两个。首先,对于没有GPS数据分析经验的行为研究人员来说,通过通用统计软件的实现来使用相对简单和容易。其次,在估计曲线时,通过简单地包括所有相关天数或行程的所有数据点,可以方便地估计整个学习过程中的典型路径。

主曲线是主成分的非线性泛化,或等效地说是非线性回归的一种变体,它允许在误差最小化时对变量进行对称处理[26].从概念上讲,曲线上的每个位置都是所有附近数据点的平均值——在本例中,是所有附近观测到的位置坐标。虽然主曲线利用类似的最小二乘准则作为线性回归,但与回归框架中的响应变量相比,它们最小化了所有变量的平方偏差。这非常符合路径估计的无监督学习目标[27].

在旅行行为的背景下,主曲线是非参数的光滑,反映了一个人的典型路径旅行。各种作者对主曲线给出了多种技术定义和相应的算法[26282930.313233].我们使用[所描述的方法]26并在R中的princurve包中实现[34].该方法从主成分线开始,遵循标准的期望-最大化(EM)方法,在更新曲线的投影和条件期望的计算之间迭代,直到从所有点到曲线的总平方距离的变化小于预先指定的阈值。我们在期望步骤中使用广义交叉验证来平滑样条拟合,尽管平滑器存在各种选项,并且可以被替代。在拟合主曲线后,进一步改进估计路径的调整将在本节的末尾描述。

将主曲线框架应用于旅行行为的一个重要限制是所得到的简单曲线不能相互交叉。因此,在一次旅行或一天中自然发生的一些旅行模式可能是不可能估计的。这种类型的出行行为在人口密集的城市环境中更有可能发生。有几种方法可以解决这个限制。一种选择是使用观测数据的细粒度分割来开发子组,以每次拟合典型路径的部分,从而得到基于较短行程或行程段定义的主曲线集合,这些主曲线可以嵌套在组内进行分析。另一种选择是使用更顺畅的替代方法。例如,局部拟合主曲线的策略可以解决这些情况[3233].打印曲线包在R [34]提供了一种周期性的LOWESS来拟合封闭曲线,可以反映在一个循环中旅行。第三种选择是将观测点的时间或时间顺序作为第三个变量,以防止由于稍后穿越一段时间而在二维上发生的自交叉,例如在离开时返回同一路线,或采用立体式公路立交。随着时间的推移估计路径,如果时间偏差不感兴趣,路径可以简化为二维,以便计算偏差,或者路径可以保持在三维,以便除了位置偏差外,还可以研究时间偏差。

除了主曲线之外,文献中还提出了几种方法,用于从基于点的位置数据中估计和平滑路径,例如样条曲线和函数数据分析技术[35],隐马尔可夫模型[36],卡尔曼滤波器[37].所有这些统计平滑技术都需要选择一个或多个调谐参数,这些参数描述平滑假定的底层函数形式的时间间隔和顺序(在样条和基于核的平滑器的情况下)或测量和整个过程中预期的噪声量(在卡尔曼滤波器的情况下)[37].主曲线同样需要关于调谐参数的决策;然而,已经提出了对主曲线算法的许多修改,允许灵活地适应各种情况的框架。出于这个原因,我们选择将主要曲线作为一种广泛应用的技术——尽管考虑到有关旅行行为的特定假设,其他技术可能更可取。无论选择哪种平滑技术,估计的典型路径都应该被绘制出来,并以视觉方式评估与观察点的拟合优度,并确保估计的典型路径根据既定的旅行行为理论是合理的。

一旦估算出了典型路径,研究人员可能会选择使用额外的技术来对估计的典型路径进行调整,以提高精度并添加上下文。这些可选的任务可以补充平滑过程,以提供最准确的典型路径,尽管它们应该谨慎地进行,以避免过度拟合。其中一种技术是地图匹配,它利用地理空间的已知特征,如道路和交通模式,来优化估计的旅行模式[38].地图匹配技术将位置视为图中由有向边连接的节点,这些节点可以匹配到已建立地图中的已知节点和路段。一些研究人员提出了地图匹配算法来定义或改进估计路径[39],特别是在低采样率的情况下[40].虽然这些技术可以在假设所有旅行都是沿着已知道路的情况下提高单个旅行估计路径的准确性,但它们需要一个道路网络参考库。替代的主曲线拟合技术也可以通过引入额外的数据来改善拟合,例如,[41]为主曲线估计提供了一种自适应算法,它包含了已知的端点,允许指定已知的起点和终点来进行行程分组,从而提高终点附近路径的拟合。

自我报告的典型路径

我们注意到,典型旅行路线的自我报告为数据驱动的路径估计提供了一种替代方案。自我报告的典型路径也可以作为数据驱动路径的补充,用于验证路径或比较结果——例如,在对回忆感兴趣的研究中。在分析之前,这些路线可以被简单地存储为逐转弯方向或有序的路径点列表(例如,道路的交叉路口)。根据之前建立的分组,每个人可能需要收集多条路线。在获得自我报告的典型路径时,提供当地地图并询问后续问题以验证他们对典型旅行行为的反映是有帮助的。像这样的问题:“你在这条路上通常会有什么停留吗?”或者“堵车时你会选择不同的路线吗?”可以验证回忆,而诸如“你也在周末旅行吗?”可以确保没有漏掉特定于参与者的分组。一旦建立了典型路径,无论是使用数据驱动技术还是自我报告,研究人员都可以进行计算偏差的下一步。

计算偏差

一旦定义了典型的旅行路线,下一步是计算每个观测位置点到相关典型路径的距离。与典型路径的估计一样,记录偏差的步骤是模块化的,可以用适合特定应用的替代方案来替换或构建。在这里,我们强调使用欧几里得距离来量化每个观测到估计路径的距离。

我们从属于特定估计路径的点的集合开始。最直接的组织方法是根据已经估计出典型路径的同一分组将观察到的点子集化——例如,当为工作日和周末估计了单独的路径时,根据工作日路径计算工作日点的偏差,并根据周末路径计算周末点的偏差。给定分组中的点不应该属于多个路径(即,每个点可以属于工作日或周末,但不能两者都属于),但可以只属于更长的典型路径的一部分,这取决于解释目标。例如,可以使用基于一整天行程的路径来计算和研究仅早晨通勤的偏差。

通过距离测量,每个点都被分配了其与相关典型路径的偏差的量化。在实践中,沿着估计路径密集采样,并使用距离观测点最近的路径点计算距离,可以找到距离路径最近的位置。通常估计的路径已经存储在统计软件中,作为密集的点采样,这个过程可以通过计算从观察点到所有路径点的距离并取最小值来自动化。距离可以反映空间偏差(如前往新位置),时间偏差(如在新时间前往既定位置),或者两者兼有——这取决于时间是否包含在典型路径的估计中,以及在哪个维度中计算距离。

偏差的最简单版本是基于欧几里得距离的空间偏差,以产生从观测点到典型路径的“直线距离”。进一步的调整,如使用哈弗辛距离或地图投影来调整地球的曲率,是可能的[42]——尽管在许多情况下,这些调整与真实世界中被动位置跟踪的测量误差相比微不足道。距离也可以使用沿道路的旅行距离或估计的旅行时间来测量,以获得从当前点恢复沿典型路径旅行所需的更实际的运动测量。

偏差分析

该框架的最后一步是分析偏差,以深入了解非典型行为。一旦计算出每个点的距离,就可以使用各种方法单独或与互补信息一起分析它们。如果数据被分离到多个数据集进行路径估计和偏差计算,在分析之前可能需要将它们重新组合成一个保留标签的单一数据集。

计算偏差的过程导致每个观察点的计算偏差。根据GPS设备的采样率和旅行距离,这可能意味着为分析定义的每个旅行行为分组(例如,天)有数百或数千个值。这些丰富的数据允许采用多种分析方法。个体抽样点的偏差可直接用于多水平模型、增长曲线模型或其他基于研究问题关注个体内方差和协方差的技术[43].这些模型解决了位置跟踪研究的纵向、重复测量设计,以及白天和人体内观察的聚类问题——这使得它们很自然地适合于许多关于旅行变异性的研究问题。通过包括时间戳和偏离估计路径的聚类观察,可以采取其他步骤来识别非典型目的地。

还可以得出总结措施,以表明旅行行为的个体差异,作为独立或因变量使用。例如,最大偏差、总偏差或平均偏差,或分组中的偏差簇数也可能是有用的估计量。所有偏差的平均值可以解释为对估计的典型路径的“拟合优度”的度量,其中较大的平均偏差表明典型路径没有捕捉到额外的行为,测量中的误差(如噪声GPS数据),或两者兼而有之。日平均偏差可以描述每天的典型程度。在下面的例子中,我们演示了这种总结度量的效用,以及选择与项目目标一致的总结度量的重要性。分析方法的选择应与研究方案相匹配,并在分组、时间尺度、行为周期频率等方面反映既定理论。该方法还应该对任何数据质量问题具有健壮性,例如某些收集方法中出现的缺失数据和不规则采样率。

结果

我们现在用一个模拟的例子来说明我们的方法,这个例子调查了一个人的旅行灵活性。我们举这个例子的目的首先是说明典型路径技术的偏差,其次是将该技术与传统的离家距离方法进行比较,以测量日常旅行行为。通过使用模拟数据,我们能够在已知上下文中突出路径估计和偏差总结的性能。在本例中,我们模拟了一个人在50天内通过手机上的被动GPS位置跟踪观察到的旅行行为。我们的模拟数据反映了通常的通勤路线以及到其他几个目的地的旅行,但为了进行分析,我们不知道这个人的工作时间表、旅行方式或典型的上班路线和其他常见目的地。我们假设这个人经常去同一个工作场所,并基于他们每天从特定的家庭位置出发。我们希望找出一个典型的路径,它在很大程度上反映了通勤路线,使我们能够将该路线的任何扰动解释为旅行灵活性的反映——[25]以观察到的流动性增加。我们通过将我们的方法与其他标准的移动性方法进行比较来评估我们的方法。最后,我们在实际数据上演示了所提出的路径估计技术,以显示在这种情况下主曲线过程的能力和限制。

模拟数据描述

我们使用谷歌Directions API模拟了一个人50天内的位置数据。44]通过googleway R包访问[45].这个人每天都从家里出发。在大多数日子里,这个人从家到公司再回到家的路线都是相同的。在其他日子里,这个人从家里上班到一个特定的商店再回家,或者从家到一个非工作地点再回来。研究人员在中西部城市中选择了关键地点,以利用现实的地理和道路所迫的旅行模式。API建议的每种旅行模式的路线都没有离题。在这个模拟中没有使用观察时间戳。

在谷歌方向API生成路由后,使用R包googleway将它们转换为经纬度坐标[45]并且重复了50天的路线,出现了以下比例的模式:70%的天遵循从家到工作再回来的正常通勤,没有额外的停留(“通勤日”);20%的日子是日常通勤,包括下班回家时在商店多停一站(“通勤-购物日”),10%的日子是往返于家以外的五个其他目的地之一(“目的地日”;2%,或各一天)。每天,沿着选定的路径对点进行采样,平均间隔350米,这反映了智能手机等位置跟踪设备收集位置数据的不规则性。对于通勤日,这导致平均每天213次观测。为了进一步模拟典型智能手机位置数据中的噪声,在纬度和经度坐标中添加了小的独立扰动。这些扰动均为正态分布,均值为0,标准差为0.002°。在选定的地理区域,0.002度大约是220 meters北或南,160米东或西。用于模拟数据的示例R代码可在附加文件中获得1。

方法在模拟数据中的应用

对于我们的模拟数据,我们将逐步将我们的方法应用于模拟数据。我们的研究问题是“每天上下班的路程与正常路线有多大出入?”

第二步是将有关研究问题和现有数据的理论形式化。我们确定每个观测到的位置坐标都作为一个观测到的旅行行为的度量,并且这些观测嵌套在上下班的通勤中。我们进一步假设工作地点和家庭地点在观察的时间内是稳定的。通勤是一种持续一整天的行为,包括早上和晚上的通勤,这种行为在大多数日子里每天重复,没有额外的行为周期嵌套,如工作日和周末的行为。我们假设在整个研究过程中行为是稳定的,通勤或偏差没有增长或收缩。一个典型的路径被认为是存在的,并反映出个人喜欢的通勤路线。

接下来,我们开始了第三步,将目标动态操作化,并建立决定数据处理决策的分组。考虑到我们的研究问题和理论都不关注一天中的特定时段,而是将通勤行为视为一整天中展开的过程,我们保留了所有GPS观测数据。每一天都作为一个分组,在此基础上估计典型路径。没有已知的或理论化的更高级别的天分组,如工作日和周末,因此估计一条路径作为所有天的参考旅行行为。为了数据组织,我们以长格式保留样本,其中每个观测位置为一行,列为纬度、经度、研究日和模拟路线类型。通常,路由类型标签是未知的——然而,分组标签(如工作日和周末)可能基于先验假设而存在。为了演示我们的方法,我们使用这些路由标签总结了偏差。

然后,我们应用了从数据中提取有意义信息的两阶段程序,从第四步开始,使用所有50个模拟研究日的所有点估计单个主曲线,以揭示单个数据驱动的典型路径。对于这个例子,我们使用R[中的princurv包估计主曲线[34].数字1显示了数据采样的7条路径,以及估计的典型路径。从该图中,我们可以看到,估计的典型路径非常接近通常的通勤路线,平滑了小弯道。在拟合主曲线后,没有进行额外的处理,因此这条估计的典型路径不受道路的约束。为了提供从理想地图匹配的典型路径获得的偏差的比较,我们包括了真实的通勤路线作为估计典型路径的替代方案。

图1
图1

所有模拟路线和估计的典型路径。用于显示重叠线条的抖动。每个目的地有5个,以及更常见的通勤路线(70%的天)和通勤-购物路线(20%的天)。家庭、工作地点和在通勤和购物路线中去过的商店的位置都被标记出来。

数字2显示了这个典型的路径叠加在三个不同日子的点上,每个点的颜色反映了采样的旅行模式类型。在视觉上很容易区分目的地当天的路线,但通勤日和通勤-购物日的区别就不那么明显了。

图2
图2

选择三种天的观测位置。估计的典型路径与真实的通常通勤路线和三个不同日期(通勤日、通勤-购物日和目的地日)的点叠加。所有站点都有标记。

接下来,我们获得每个观察点的路径偏差,并将这些值作为与数据集中每个观察点相关的附加变量存储。由于采用了主曲线拟合程序,在典型路径估计中使用的每个观察点在最终曲线上都有相应的投影。利用观测到的位置和投影,我们计算出每个观测到的距离。除了估计的典型路径外,我们还计算了从每个观察点到已知通勤路线的最小距离。为了这个演示,我们计算了哈弗辛距离,它类似于欧几里得距离,但考虑了地球的曲率,使用R包岩石圈内的distHaversine函数[42].我们选择这种方法来计算偏差,以显示在简单欧几里得距离上的增量。用于估计主曲线和计算偏差的示例R代码可在附加文件中获得2。可选的曲线拟合程序可能需要可选的步骤,例如密集地插入典型路径曲线,以确定对应于每个观测值的投影。

在这一点上,我们注意到,通过从图中计算通勤和购物日的估计典型路径的偏差2,我们可以系统地识别去商店的行程,以协助分析和解释。数字3.显示所选通勤和购物日的点,阴影是基于它们与估计典型路径的计算偏差。我们可以看到商店周围的偏差很高,突出了这一天旅行行为的潜在灵活性,允许这次短途旅行。在家里也有很大的偏差。由于估计的典型路径的终点和所在位置之间的差距,这对每天都是如此,这表明典型路径估计中的任何不匹配都可能对下游产生影响。这样的可视化对于模型不匹配的解释和质量检查都是至关重要的。我们还可以看到观测点存在噪声,导致估计路径上一些点的偏差较大,而另一些点的偏差较小。可以进行额外的数据处理以减少测量噪声,但也可能产生意想不到的后果,如消除或衰减真实偏差。

图3
图3

通勤和购物日的观察被偏离典型路径遮蔽。根据与使用主曲线估计的典型路径的计算偏差(以米为单位),从单个通勤和购物日记录的观测位置被阴影化,主曲线显示为实线。所有站点都有标记。最大的偏差是在存储停止点和home端点附近观察到的。

我们框架的最后一步是分析偏差。在分析多个个体的出行行为时,我们建议使用多级模型、增长曲线模型或其他关注个体内部差异的方法。对于这个仅包含一个个人数据的简单示例,我们将分析限制在创建每天平均偏差和最大偏差的汇总度量。表格2显示每种类型天的这些汇总测量的平均值和标准偏差,并比较从估计的典型路径和真实通勤路线获得的偏差。我们可以看到,两种汇总度量都揭示了三种类型的天与相关路径的偏差程度的差异,计算偏差最小的属于通勤日,偏差最大的属于目的地日。在通勤和通勤购物日之间,偏差的可变性相似。估计的典型路径的发现与我们的预期一致,即估计的典型路径将反映通常的通勤路线,并为我们的研究问题提供了见解(“每天上班的通勤与典型路线偏离了多少?”)。结果显示,在个人只通勤的日子里,每日通勤的偏差最小,在个人在通勤期间停下来购物的日子里,偏差增加,而在旅行不是真正的通勤行为的日子里,偏差最大。以真实通勤路线为参考时,偏差值较小,说明用主曲线估计典型路径不完善。然而,在两个参考路径选项的偏差摘要中可以看到一致的模式。

表2每种类型日的平均偏差和最大偏差的汇总度量

与现有方法的比较

本文的另一个目的是表明,在回答有关旅行行为可变性的研究问题时,我们对典型路径技术的偏差优于标准离家距离测量。数字4将偏差与离家最大距离进行比较,这是一种常见的生活空间测量方法。我们分别总结了估计的典型路径和真实通勤路线的偏差,以进一步比较这两个选项。为了建立一个共同的时间尺度,以便对这些测量进行比较,我们首先总结了每天的偏差,以获得最大偏差(当天观测到的最大偏差值)或每天所有偏差的平均值,同时使用原始观测值计算离家的最大距离。

图4
图4

在相互竞争的汇总度量中,有和没有购物的通勤日偏差的差异分离。对于估计的典型路径和真实的通勤路线,使用与典型路径的所有计算偏差的平均值提供了两个相似类型的日子之间的最大间隔——一个人只通勤的日子和一个人通勤和购物的日子——而使用单一距离参考单个点的传统测量提供了最小的间隔。当使用真实通勤路线作为参考而不是估计的典型路径时,分离更大。在这个比较中,Haversine距离(以米为单位)用于所有测量,但图中显示的值范围不同。重点是在每个图中不同的日类型之间的分离,而不是在图中比较每种类型的日。

这个简单的模拟表明,研究从数据估计的典型路径的偏差可以在有利的条件下恢复关于异常传播行为的信息,例如观测点的正态分布测量误差,足够的采样密度,以及满足估计典型路径的主曲线特征的明确的流行传播行为。

使用真实数据的路径估计应用

为了证明我们提出的数据驱动的典型路径方法(步骤4)是可以使用真实数据的,我们从GeoLife GPS轨迹数据集中选择了单个个体6天的相似旅行行为[464748],使用带有LOWESS平滑器的主曲线估计典型路径,并计算与估计典型路径的每日最大距离和平均距离。此演示的代码可在附加文件中获得3.。数字5表明估计一个典型的路径是可能的,该路径近似于普遍观测到的旅行行为,并且受到测量误差的影响最小。该示例还显示了在某些现实场景中使用单一主曲线来估计行程的局限性:这个人似乎在地图的西部边缘附近的旅行中后退了,而单一主曲线不能包含这样的循环。但是,表中总结了每天的平均偏差3.相对较小,表明估计路径与观测点的偏差不大。表格3.还突出显示了由每天计算的平均偏差和最大偏差所捕获的逐日变化——例如,与其他五天相比,第3天的平均偏差更高。

图5
图5

应用于实际数据的主曲线典型路径估计。估计一个人六天内的典型路径和旅行行为。

表3每日平均偏差和最大偏差的汇总测量

讨论

GPS和其他位置跟踪技术促进了方便和负担得起的个人旅行行为的收集,从而使对行为模式的研究成为可能,从而解决涉及公共卫生、城市设计、交通路线等主题的重要问题。虽然现有的工作已经为这类问题建立了位置跟踪的效用[1]并为分析这些数据提供了多种指标[2],我们注意到相对较少的工作已经开发出关注个体内部变异性的方法,尽管已经证明需要[78910].相反,现有的方法倾向于将行为概括为旅行和日常行为的高度聚合度量[3.4562223].我们提供了一个框架,该框架不仅模拟了个人的普遍行为,而且还强调了非典型的旅行行为,可以为个人内部的可变性和变化提供新的见解。在我们的框架内估计的偏差可以用来总结旅行行为动态中的个体差异,或者作为与日常经验相关的时变现象。在我们的模块化框架中,我们为典型路径的数据驱动和自我报告定义提供了指导方针,并概述了计算偏离既定路径的过程。我们表明,我们的方法捕捉了日常旅行行为的可变性,而这种可变性被离家的距离测量所掩盖。

结果的讨论

通过我们的结果部分,我们提供了建议框架的应用和效用的示例。使用一个包含50天主要通勤行为的模拟数据集,我们展示了如何使用主要曲线来估计反映当前通勤行为的典型路径。我们展示了从这条估计路径测量的偏差如何与从真实通勤路线测量的偏差进行比较。模拟数据的使用提供了每天已知标签和已知通勤行为的好处,以演示使用建议路径估计和偏差计算选项的方法的性能。我们还证明了主曲线方法可以应用于真实的旅行数据,并强调了额外的复杂性和数据质量问题,可能需要逐个修改方法来解决。

我们的程序捕获有意义的旅行行为,因为远离典型路径的旅行是可见的不同的高偏差点集群,无需额外处理。例如,在远离典型路径的日子里,较大的偏差表明有意义的旅行行为超出了测量噪声和仅在通勤日捕获的估计路径的不准确性。这表明,即使使用简单的路径估计过程(如未处理数据上的主曲线),也可以提取有意义的信息。然而,我们对相对于估计的典型路径的计算偏差的可视化显示,即使是只通勤的日子,因此应该匹配典型路径,也具有非零偏差。这可以归因于两个变量来源-点的测量噪声和估计路径的不准确性。我们证明,当使用已知通勤路线作为参考时,偏差更低,从而消除了估计路径的不准确性。因此,预处理步骤,如映射匹配[383940]可以改善典型路径估计和用于计算偏差的观测位置。

我们还展示了如何研究偏差以提供新的见解。我们对简单的汇总测量的比较表明,按天的类型进行平均不仅恢复了预期的趋势,而且通勤和购物日的偏差更大,而且这些偏差可以用来识别在既定行为附近发生的非典型行为。例如,当使用离家的最大距离来测量旅行行为时,会错过在商店的停留。这突出了我们提出的框架的一个关键创新:将参考从单个已建立的点(如home)更新为使用由典型路径测量的已建立的旅行行为作为参考。我们的研究结果表明,目前的方法可能低估了旅行行为的灵活性,而我们提出的框架通过额外捕捉参考位置和最遥远位置之间可能发生的各种旅行,为新的见解提供了潜力。

我们使用应用于真实数据的主曲线的路径估计示例反映了基于模拟数据的发现。总的来说,计算出的偏差很小,这表明这一估计的典型路径可能足以解决有关非典型旅行行为的研究问题,如访问新目的地或新路线选择。在计算偏差之前,可以采取其他特定于情况的步骤,如分割旅行行为或包括时间排序,以更紧密地模拟个人层面的典型旅行行为。

虽然我们的示例使用汇总度量来显示通过将每个观测值定向到一条路径而不是单个点而实现的差分分离,但计算出的偏差也可以直接用于其他建模框架,如多层模型。在分析中直接使用偏差的优点包括允许每个观测提供唯一的信息,每天进行多次测量而不是一次测量,使我们能够考虑多个时间尺度上的可变性。至关重要的是,我们证明了偏离典型路径提供的旅行行为信息与普通现有测量方法不同——更具体地说,它们描述了旅行行为有多不寻常,而不是从设定的位置旅行有多远。这就提出了关于非典型旅行和旅行灵活性的新问题,这些问题以前受到现有方法的限制。

方法的讨论

我们提出了一个分析位置跟踪数据的新框架,该框架强调了作为有意义的行为指标的旅行行为偏差。这种方法可以直接分析个人的日常变化,并识别非典型的旅行行为。现有的位置跟踪数据分析工作主要集中在总结典型的旅行行为,并将偏差视为噪声[2].这些现有的方法,如离家的距离和生命空间椭圆,掩盖了发生在参考位置和最遥远位置之间的各种旅行行为。我们提出的对典型路径偏差的强调,有助于理解整个旅行行为中个体间和个体内的可变性,并可以通过智能手机等现有技术实现被动位置跟踪。

这个框架在估计路径和偏差方面提供了很大的灵活性,使其适用于各种研究问题。特别是,可以采用多种方法来估计典型路径和计算这些路径的偏差。典型路径可以使用各种算法进行估计,例如本文描述的主曲线方法,或者使用包含额外信息的过程,例如通过地图匹配限制到道路。数据驱动路径估计的替代平滑或方法可能在特定情况下和特定的研究问题中工作得很好。这里记录的主要曲线方法提供了一个灵活的、数据驱动的选项,适合每个人的曲线,而不需要专门的工具或软件。我们的方法允许在地理和建筑环境知识未知的情况下进行数据分析。

重要的是,我们所描述的原理曲线方法并不排除自我报告或其他预先定义的典型路径。相反,在估计偏差时,这些预定义路径可以作为数据驱动的典型路径的替代或补充。我们提倡数据驱动方法,因为它最大限度地减少了参与者的负担和回忆偏差。此外,数据驱动的方法很容易适应现有跟踪数据的二次分析,而不能对以前收集的数据中所代表的个人提出额外的问题。

我们的技术也很灵活,因为典型路径可以代表个人特有的特定行程、个人的日常路线或分组个体的共同行为。类似地,偏差可以估计使用欧几里得距离,或额外的信息,如已知的街道可以用来估计车辆运输的真实旅行距离。此外,该框架可以在许多尺度上应用——虽然本文中的示例主要集中在街道上的车辆旅行,但该方法可以应用于理解单个建筑物内的运动,如办公空间或长期护理设施。

局限性和未来发展方向

我们的框架为识别非典型出行行为和出行行为的灵活性提供了很大的灵活性。这使得研究人员对个体内部的变异性有了新的见解。然而,这种方法的潜力必须在其局限性的背景下加以看待。首先,我们承认我们的正式模型假设可能会限制在特定情况下的应用。例如,如果典型路径不存在,那么应用框架将具有挑战性。事实上,之前的研究已经发现,在非通勤旅行中缺乏典型的旅行行为[14],强调需要确保研究问题和背景支持典型的路径假设。此外,现实行为通常包括带有循环的路径,这违反了许多路径估计技术的空间拟合假设,包括这里突出显示的主要曲线。违反这些假设的潜在解决方案可能包括修改理论化的目标动力学和数据组织分组,以确保理论和研究问题与使用该技术相一致。

我们还注意到,现实世界的被动位置跟踪数据,如智能手机位置数据,也带来了可能影响该框架应用的挑战。在技术方面,智能手机位置数据的数据缺口和采样率的不规则性很常见[49],尤其是在人口密集的城市环境中。丢失数据的上下文将决定数据丢失的影响有多大。例如,在直线高速公路上,如果有规律地丢失观测数据,偏离不太可能或不可能,那么对典型路径的估计和结果的影响将是最小的。然而,在人口密集的城市地区,由于有很多机会外出,因此缺乏观测可能导致无法识别真正的偏差。我们的方法确实为偶尔丢失的数据提供了一些鲁棒性,这是由于在研究过程中多次重复的行为观察的纵向收集。处理缺失的数据可能需要特定于情况的解决方案,但一般的方法是更重视某些观测值或插值定位,这可能会改善典型的路径估计和偏差分析。估计典型路径的替代方法,例如映射匹配,可以在这些上下文中提供改进。未来的工作应该探索在现实数据中的应用,包括典型路径估计的可靠性研究,以及具体情况的解决方案。

最后,未来工作的一个重要领域将是处理发生在偏差测量和违反下游分析方法假设的模式。与典型路径上的偏差不同,典型路径上的偏差应该很小,并反映测量和估计路径中的噪声,远离典型路径的连续偏差值将表现出自相关性。结合使用时间戳是识别这些模式的一种可能方法。时间序列技术可以在保留所有值的同时解决自相关问题。或者,传统上用于未处理位置跟踪数据的测量方法[2]可以通过将参考从单点更改为典型路径来应用。例如,离开路径所花费的时间可能是偏差的相关汇总度量。进一步研究这些和其他基于典型路径偏差(包括时间偏差)的总结措施,是未来适应和研究其统计特性的一个领域。

结论

总之,我们的框架强调了旅行行为的偏差,以便在不同的内容领域对旅行行为的灵活性和异常进行新颖的研究。该框架通过利用密集抽样的个人被动位置跟踪的便捷性和可承受性,有助于回答有关旅行行为和健康的新问题。研究人员有很大的灵活性来微调特定研究问题和特定背景的方法,我们提供的初步建议在我们的逐步指南中广泛适用,以促进易于实施。

数据和材料的可用性

生成和分析数据的示例代码包含在附加文件中。

缩写

API:

应用编程接口

新兴市场:

采用

全球定位系统(GPS):

全球定位系统

洛斯:

局部加权散点图更平滑

参考文献

  1. Fillekes MP, Röcke C, Katana M, Weibel R.健康老年人样本中自我报告与gps衍生的日常活动指标。医学社会科学2019;220:193-202。https://doi.org/10.1016/j.socscimed.2018.11.010

    文章PubMed谷歌学者

  2. Fillekes MP, Giannouli E, Kim EK, Zijlstra W, Weibel R.建立一套全面的基于gps的指标,反映日常流动性的多维性,用于健康和老龄化研究。国际卫生地理杂志,2019;18(17)。https://doi.org/10.1186/s12942-019-0181-0

  3. Boissy P, Blamoutier M, Brière S, Duval C.使用可穿戴传感器量化健康老年人的自由生活社区流动性。前沿公共卫生,2018;6(8月):1-13。https://doi.org/10.3389/fpubh.2018.00216

    文章谷歌学者

  4. Hirsch JA, Winters M, Clarke P, McKay H.生成GPS活动空间,揭示老年人的移动习惯:描述性分析。国际卫生地理杂志,2014;13(51)。https://doi.org/10.1186/1476-072X-13-51

  5. 申克AK,维特布罗特BC,霍蒂CA,卡尔森RH,古尔丁EH,波特JF,博纳塞拉SJ。移动电话可以测量居住在社区的成年人的活动和寿命:原理的证明。中华老年医学杂志,2011;39(2):344 - 344。https://doi.org/10.1111/j.1532-5415.2010.03267.x

    文章PubMed公共医学中心谷歌学者

  6. Wan N, Qu W, Whittington J, Witbrodt BC, Henderson MP, Goulding EH, Katrin Schenk A, Bonasera SJ, Lin G.评估智能手机生成生活空间指标。环境规划B规划Des. 2013; 40:350-61。https://doi.org/10.1068/b38200

    文章PubMed公共医学中心谷歌学者

  7. Pendyala RM, Pas EI。多天、多时段的出行需求数据分析与建模。TRB交通研究通告E-C008:交通调查:提高标准,2000;1-28。

  8. 不是EI。最小二乘回归行程生成模型的多日样本、参数估计精度和数据收集成本。环境规划A. 1986; 18:73-87。https://doi.org/10.1068/a180073

    文章谷歌学者

  9. Pas EI, Koppelman FS。对个人城市旅行行为日常变化的决定因素的研究。运输。1987;14(1):3。https://doi.org/10.1007/BF00172463

    文章谷歌学者

  10. 李海红,郭恩泽,李文杰。基于全球定位系统的车辆活动数据的晨间通勤路径选择模式分析。运输资源记录J运输资源委员会,2005;1926:162-70。https://doi.org/10.3141/1926-19

    文章谷歌学者

  11. Baker PS, Bodner EV, Allman RM。测量居住在社区的老年人的生活空间流动性。中华老年医学杂志2003;51:1610-4。https://doi.org/10.1046/j.1532-5415.2003.51512.x

    文章PubMed谷歌学者

  12. 李志刚,杨志刚,李志刚,李志刚,李志刚,李志刚。柳叶刀》。2013;381(9868):752 - 62。https://doi.org/10.1016/s0140 - 6736 (12) 62167 - 9

    文章PubMed谷歌学者

  13. Diehl M, Hooker K, Sliwinski MJ,编辑。在整个生命周期内的个体变异手册。纽约州纽约州:劳特利奇;2015.

    谷歌学者

  14. 康H,斯科特DM.探索家庭成员时间使用的日常变化。交通运输条例A部分政策实施细则。2010;44(8):609-19。https://doi.org/10.1016/j.tra.2010.04.002

    文章谷歌学者

  15. 用智能卡数据在多个月的尺度上调查交通使用的日常变化。里昂的案例研究。旅行行为社会学。2020;19:112-23。https://doi.org/10.1016/j.tbs.2019.12.003

    文章谷歌学者

  16. 龙J, Reuschke D.后工业化城市小企业主和家庭工人的日常流动模式。城市生态学报,2015;29(1):67 - 74。https://doi.org/10.1016/j.compenvurbsys.2020.101564

  17. Sun S, Folarin AA, Ranjan Y, Rashid Z, Conde P, Stewart C, Cummins N, Matcham F, Costa GD, Simblett S, Leocani L, Lamers F, Sørensen PS, Buron M, Zabalza A, Pérez AIG, Penninx BWJH, Siddi S, Haro JM, Myin-Germeys I, Rintala, Wykes T, Narayan VA, Comi G, Hotopf M, Dobson RJB。使用智能手机和可穿戴设备监测COVID-19期间的行为变化。中国医学互联网杂志,2020;22(9):1-19。https://doi.org/10.2196/19992arXiv: 2004.14331

    文章谷歌学者

  18. Giannouli E, Bock O, Mellone S, Zijlstra W.老年人的流动性:能力不是表现。(2016)。https://doi.org/10.1155/2016/3261567

  19. 斯托维BT,奥斯利C,斯隆ME,鲍尔K.生活空间问卷:老年人流动性程度的测量。应用老年医学,1999;18(4):460-78。https://doi.org/10.1177/073346489901800404

    文章谷歌学者

  20. 保龄CB,芒特纳P,索耶P,桑德斯PW,库特纳N,肯尼迪R,奥尔曼RM。肾功能降低的老年人的社区流动性:生活空间的研究。中华肾脏病杂志2014;63(3):429-36。https://doi.org/10.1053/j.ajkd.2013.07.022

    文章PubMed谷歌学者

  21. 皮尔C,索耶贝克P,罗斯DL,布朗CJ,布罗德纳EV,奥尔曼RM。评估老年人的活动能力:老年生活空间评估的UAB研究。物理学报,2005;85(10):1008-119。https://doi.org/10.1093/ptj/85.10.1008

    文章PubMed谷歌学者

  22. 李志,丁斌,韩杰,Kays R, Nye P.运动目标周期行为挖掘。见:ACM SIGKDD知识发现和数据挖掘国际会议论文集。2010;1099-1108。https://doi.org/10.1145/1835804.1835942

  23. 吕敏,陈亮,陈刚。基于日常活动的用户相似度挖掘。科学通报,2013;https://doi.org/10.1016/j.ins.2013.02.050

    文章谷歌学者

  24. Hatcher SG, Mahmassani HS。每天的路线变化和晚上通勤的行程安排决定。运输Res Rec 1992; 1357:72-81。

    谷歌学者

  25. Susilo Y, Kitamura R.个人行动空间的日常变化分析:6周mobidrive旅行日记数据的探索。运输资源记录J运输资源委员会,2007;192:124 - 33。https://doi.org/10.3141/1902-15

    文章谷歌学者

  26. Hastie T, Stuetzle w,主曲线。《中国统计杂志》,1989;44(6):516 - 516。https://doi.org/10.1080/01621459.1989.10478797

    文章谷歌学者

  27. C. GPS轨道的路径估计。见:第九届国际地理计算会议论文集。2007.

  28. Tibshirani R.重温主要曲线。统计研究。1992;2(4):183-90。https://doi.org/10.1007/BF01889678

    文章谷歌学者

  29. Kégl B.主曲线的学习与设计。电子工程学报。2000;22(3):281-97。https://doi.org/10.1109/34.841759

    文章谷歌学者

  30. 吴晓东,王晓东,王晓东,Kröse B.基于k-段的主曲线算法。模式识别,2002;23(8):1009-17。https://doi.org/10.1016/s0167 - 8655 (02) 00032 - 6

    文章谷歌学者

  31. 李志强,李志强。统计学习的要素。第二版。纽约:施普林格;2009.

    谷歌学者

  32. 熟食P.另一个看主要的曲线和表面。中国农业科学。2001;26(1):1 - 5。https://doi.org/10.1006/jmva.2000.1917

    文章谷歌学者

  33. Einbeck J, Tutz G, Evers L.局部主曲线。统计研究,2005;15(4):301-13。https://doi.org/10.1007/s11222-005-4073-8

    文章谷歌学者

  34. cannoodle R. princurve 2.0:拟合任意维度的主曲线。凹口。2018.https://doi.org/10.5281/zenodo.3351282https://github.com/rcannood/princurve

  35. 胡旭,袁勇,朱旭,杨红,谢凯。基于智能手机GPS轨迹数据的预规划道路减量行为响应:一种功能数据分析方法。智能交通系统技术规划,2019;23(2):133-43。https://doi.org/10.1080/15472450.2018.1488133

    文章谷歌学者

  36. 张晓东,李志强,李志强。基于模糊HMM模型的移动路径推断方法。运输。2018;45(1):233 - 46。https://doi.org/10.1007/s11116-016-9734-2

    文章谷歌学者

  37. G君,gunsler R, Ogle JH。平滑方法最小化全球定位系统随机误差对旅行距离、速度和加速度轮廓估计的影响。运输资源记录J运输资源委员会,2006;1972:141-50。https://doi.org/10.3141/1972-19

    文章谷歌学者

  38. Yildirimoglu M.基于蓝牙观测的路径和旅行时间的联合估计。交通运输学报,2018;29(1):324-42。https://doi.org/10.1080/21680566.2020.1852128

    文章谷歌学者

  39. 马古德斯,奥钦WY,诺兰德RB。交通应用中的地图匹配算法现状及未来研究方向。交通运输技术。2007;15(5):312-28。https://doi.org/10.1016/j.trc.2007.05.002

    文章谷歌学者

  40. 楼艳,张超,郑勇,谢晓,王伟,黄艳。低采样率GPS轨迹的地图匹配。GIS。见:ACM地理信息系统进展国际研讨会论文集,2009;352-361。https://doi.org/10.1145/1653771.1653820

  41. 张军,陈东,张建军。智能交通系统自适应约束k段主曲线。电子工程学报。2008;9(4):666-77。https://doi.org/10.1109/TITS.2008.2006780

    文章谷歌学者

  42. Hijmans RJ, Williams E, Vennes C.球面三角:包“地质圈”。2019.https://CRAN.R-project.org/package=geosphere

  43. 赫什伯格SL,莫斯科维茨DS,编辑。用重复测量数据建模个体内变异:方法和应用。纽约州纽约州:劳特利奇;2013.

    谷歌学者

  44. 谷歌方向API。https://developers.google.com/maps/documentation/directions/overview

  45. Cooley D. googleway:访问谷歌地图api检索数据和绘图地图;2020.https://CRAN.R-project.org/package=googleway

  46. 郑勇,谢旭,马卫勇。从gps轨迹中挖掘有趣的位置和旅行序列。见:2009年万维网国际会议论文集(2009)。https://www.microsoft.com/en-us/research/publication/mining-interesting-locations-and-travel-sequences-from-gps-trajectories/

  47. 郑勇,李强,陈勇,谢晓,马文勇。基于gps数据了解移动。见:第十届普适计算国际会议论文集。UbiComp ' 08,第312-321页。计算机协会,纽约,纽约,美国;2008.https://doi.org/10.1145/1409635.1409677

  48. 郑勇,谢旭,马卫勇。Geolife:用户、位置和轨迹之间的协作社交网络服务。IEEE数据工程,2010。

  49. 沈玲,史晓峰。GPS旅行测量与GPS数据处理方法综述。交通运输,2014;34(3):316-34。https://doi.org/10.1080/01441647.2014.903530

    文章中科院谷歌学者

下载参考

确认

不适用。

资金

这项研究的一部分是由宝洁公司的研究基金支持的。

作者信息

作者及隶属关系

作者

贡献

KN将提出的框架概念化,并进行了仿真研究。KN和SM协助解读数据、撰写和编辑稿件。所有作者都阅读并批准了最终的手稿。

相应的作者

对应到凯伦·e·尼尔森

道德声明

伦理批准并同意参与

不适用。

发表同意书

不适用。

相互竞争的利益

作者宣称他们之间没有利益冲突。

额外的信息

出版商的注意

伟德体育在线施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

补充信息

附加文件1。

模拟数据。

附加文件2。

流程分析数据。

附加文件3。

真实数据示例。

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条所提供的资料,除非在资料的信用额度中另有说明。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

尼尔森,k.e., Mejía, S.T.和冈萨雷斯,R.偏离典型路径:行为科学中使用GPS数据的新方法。国际J卫生geor21, 5(2022)。https://doi.org/10.1186/s12942-022-00305-4

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s12942-022-00305-4

关键字

  • 个体内的变化
  • 偏差
  • 持续多日的研究
  • 旅行行为的不确定性
  • 分析框架
  • GPS跟踪
Baidu
map