发布时间:2023-04-22    次浏览
本文摘要:块近似指数随机图;特征向量中心性排名的盲推论;Spotify网络中的盛行性和中心性:特征向量中心性的临界转变;使用属性网络量化社会网络辩说争议的框架:有偏随机游走(BRW);来自Twitter的恒久单词频率动态被破坏:一种定制的方法来检测和消除时间序列荟萃中的病态部门;识别虚假宣传运动中的协调帐户;“我的朋侪想谈论它,而我没有谈论”:相识社交平台中删除隐私的感知;网络运动和物理情况的团结建模可改善对访客行为的预测;MetaMetaZipf:对都会规模漫衍的分析有何配合点?
块近似指数随机图;特征向量中心性排名的盲推论;Spotify网络中的盛行性和中心性:特征向量中心性的临界转变;使用属性网络量化社会网络辩说争议的框架:有偏随机游走(BRW);来自Twitter的恒久单词频率动态被破坏:一种定制的方法来检测和消除时间序列荟萃中的病态部门;识别虚假宣传运动中的协调帐户;“我的朋侪想谈论它,而我没有谈论”:相识社交平台中删除隐私的感知;网络运动和物理情况的团结建模可改善对访客行为的预测;MetaMetaZipf:对都会规模漫衍的分析有何配合点?;协调的容量扩展问题中的近似能流和传输损耗;转换模型中消失的错误;新浪微博上多任务深度学习用户抑郁检测方法;块近似指数随机图原文标题: Block-Approximated Exponential Random Graphs地址: http://arxiv.org/abs/2002.07076作者: Florian Adriaens, Alexandru Mara, Jefrey Lijffijt, Tijl De Bie摘要: 指数随机图(ERG)领域的一个重要挑战是在大型图上拟合非平凡的ERG。通过使用快速矩阵块迫近技术,我们为这种非平凡的ERG提出了近似框架,从而发生了二元独立(即边独立)漫衍,同时能够有意义地对图的两个局部信息(例如度)举行建模以及全局信息(例如,聚类系数,分类性等)。这使人们可以有效地生成具有与视察网络相似的属性的随机网络,而且该模型可以用于多个下游任务,例如链路预测。
我们的方法可扩展为包罗数百万个节点的稀疏图。履历评估通过最新方法(通常基于将图嵌入到低维空间中)举行链路预测,展示了速度和准确性方面的竞争力,以举行链路预测,展示了更直接,更准确的潜力可解释的概率模型。
特征向量中心性排名的盲推论原文标题: Blind Inference of Eigenvector Centrality Rankings地址: http://arxiv.org/abs/2008.11330作者: T. Mitchell Roddenberry, Santiago Segarra摘要: 我们思量仅从节点上的数据预计网络特征向量中心性的问题,而没有有关网络拓扑的信息。使用图滤波器的多功效性对网络历程举行建模,将节点上支持的数据建模为图信号,该图信号是通过应用于白噪声的图滤波器的输出获得的。
我们试图通过绕过网络拓扑推断方法来简化中心性排名的下游任务,而是直接从图信号中推断图的中心性结构。为此,我们提出了两种简朴的算法,用于对由一组未视察到的边毗连的一组节点举行排名。
我们为这些算法推导出渐近和非渐近保证,展现了决议手头任务庞大性的关键特征。最后,我们说明晰拟议算法在合成和真实数据集上的行为。Spotify网络中的盛行性和中心性:特征向量中心性的临界转变原文标题: Popularity and Centrality in Spotify Networks: Critical transitions in eigenvector centrality地址: http://arxiv.org/abs/2008.11428作者: Tobin South, Matthew Roughan, Lewis Mitchell摘要: 数字音乐会见的现代时代已经增加了有关音乐消费和创作的数据的可用性,从而促进了对将音乐毗连在一起的庞大网络的大规模分析。有关用户盛行为的数据以及音乐协作网络对于新的数据驱动的推荐系统尤为重要。
如果不举行全面分析,则此类协作图可能导致错误或误导性的结论。在这里,我们展示了来自在线音乐流媒体服务Spotify的艺术家的新协作网络,并展示了艺术家的特征向量中心性的重大变化,因为低人气艺术家被删除了。从古典艺术家到说唱艺术家,中心性的关键变化都证明晰网络的更深条理的结构特性。提出了一个社会群体中心模型来模拟这种关键的过渡行为,并视察到主要特征向量之间的切换。
该模型提出了关于盛行度偏差对中心度和重要性的怀抱方式的新颖研究,并提供了一种检查网络中此类缺陷的新工具。使用属性网络量化社会网络辩说争议的框架:有偏随机游走(BRW)原文标题: A Framework for Quantifying Controversy of Social Network Debates Using Attributed Networks: Biased Random Walk (BRW)地址: http://arxiv.org/abs/2008.11453作者: Hanif Emamgholizadeh, Milad Noorizadeh, Saman Tajbakhsh, Mahdieh Hashminezhad, Farzaneh Nasr Esfahani摘要: 在已往的几年中,特别是在在线社会网络和媒体泛起之后,所有社会都变得越发南北极分化。
实际上,随着新媒体的流传,社会谱的两头之间的鸿沟将更深。在这种情况下,社会南北极分化已成为社会主义者和盘算机科学专家日益关注的问题,因为在线社会网络可能通过加剧极端主义的火力而对社会发生有害影响。
随后举行了几种类型的研究,以提出一些措施来盘算社会网络中的争议水平,然后,例如通过将一方的看法袒露给另一方的成员,来淘汰相互矛盾的看法之间的争议。量化社会网络争议的大多数实验都思量了网络的最主要形式,没有任何属性。
只管这些研究提供了可在差别社会网络中使用的无平台算法,但它们不能思量用户提供的大量有用信息(节点属性)。为了克服这一缺点,我们提出了一个框架来在具有差别属性的差别网络中使用。我们推动了一些偏向随机游走(BRW),以针对起始节点的初始能量和路径上节点的能量损失,找到它们从起点到初始未知端点的路径。
我们使用node2vec提取了网络的结构属性,并将其与最新算法举行比力,并显示了其准确性。然后,我们提取了用户的一些内容属性,并分析了它们对算法效果的影响。
将BRW与另一种最先进的争议权衡算法举行了比力。然后,它在波斯语Twitter中在差别争议级别上的变化被认为讲明了它在差别情况下的事情方式。
来自Twitter的恒久单词频率动态被破坏:一种定制的方法来检测和消除时间序列荟萃中的病态部门原文标题: Long-term word frequency dynamics derived from Twitter are corrupted: A bespoke approach to detecting and removing pathologies in ensembles of time series地址: http://arxiv.org/abs/2008.11305作者: P. S. Dodds, J. R. Minot, M. V. Arnold, T. Alshaabi, J. L. Adams, D. R. Dewhurst, A. J. Reagan, C. M. Danforth摘要: 维护恒久数据收集的完整性是一项必不行少的科学实践。随着领域的生长,该领域的丈量仪器和数据存储系统也将随着发现,革新和淘汰而不停生长。对于由不透明的社会技术系统生成的数据流(可能具有突发性和未知的内部规则更改),检测息争释历史数据集中的变化需要保持警惕和举行缔造性分析。在这里,我们显示,实时收集的Twitter的日标单词使用频率时间序列的约莫10%来自10年来约莫10,000个常用单词的实时收集,这些推文实际上来自带有损坏的语言标签的推文。
我们形貌了在比力差别时间规模内的单词使用情况时如何发现有问题的信号。我们找到Twitter打开或关闭种种语言识别算法的时间点,以及数据花样可能已更改的时间点。然后,我们演示如何建立一个统计数据,以识别和删除带有病理性时间序列的单词。
虽然我们从时间序列荟萃中删除“不良”时间序列的历程特别重要,但导致其构建的方法可能具有普遍性。识别虚假宣传运动中的协调帐户原文标题: Identifying Coordinated Accounts in Disinformation Campaigns地址: http://arxiv.org/abs/2008.11308作者: Karishma Sharma, Emilio Ferrara, Yan Liu摘要: 社交媒体上的虚假信息宣传运动越来越普遍,涉及从恶意帐户到利用民众舆论的协调运动。越来越多的证据讲明,社交媒体滥用影响其他国家的政治和社会问题,引起了许多关注。
识别和预防协调运动对于从源头上解决虚假信息已经变得至关重要。现有的检测恶意运动的方法对协调的行为举行了严格的假设,例如恶意帐户执行同步操作或共享被认为指示协调的功效。其他人则要求展现运动中的部门恶意帐户,以便检测其余部门。
这样的假设大大限制了现有方法的有效性。相比之下,我们建议使用AMDN(专心混淆物密度网络)凭据时间点历程自动从帐户运动和帐户之间的交互中发现协调的小组行为。此外,我们使用学习的模型来明白息争释虚假宣传运动中协调帐户的行为。我们发现,协调帐户之间的平均影响最大,而这些帐户受通例帐户的影响不大。
我们在与俄罗斯干预美国大选有关的Twitter数据上评估了该方法的有效性。此外,我们从Twitter收集的COVID-19数据中识别虚假宣传运动,并提供正在举行的大盛行中协调虚假宣传运动存在的第一个证据和分析。“我的朋侪想谈论它,而我没有谈论”:相识社交平台中删除隐私的感知原文标题: “My Friend Wanted to Talk About It and I Didn’t”: Understanding Perceptions of Deletion Privacy in Social Platforms地址: http://arxiv.org/abs/2008.11317作者: Mohsen Minaei, Mainack Mondal, Aniket Kate摘要: 羁系者和世界各地的用户对被遗忘权问题的关注和意识日益增强。
为相识决这些隐私问题,社交平台提供了删除机制,使用户有时机删除其内容,而且在某些情况下,平台会自动删除它们。可是,这使用户容易受到攻击者的攻击,这些攻击者会特别寻求用户的破坏性内容,并使用删除行为作为强烈的信号。在本文中,我们对191位到场者举行了用户研究,以研究他们以前的删除履历,对删除隐私的期望以及他们如何有效地找到当前的删除机制。
我们发现凌驾80%的用户至少删除了一个社交媒体帖子,而35%的删除是在公布一周后发生的。只管到场者将由于时间流逝而引起的内容无关紧要是删除其内容的主要原因,但大多数到场者认为删除表现删除的内容包罗对所有者的某些破坏性信息。
重要的是,与社交圈中的任何其他小我私家相比,到场者都越发担忧大型数据收集器(例如,第三方数据收集公司或政府)注意到他们的删除。此外,三分之一的到场者认为他们可能会受到这些大型数据收集器的攻击。最后,到场者发现当前的删除机制不足以掩护其删除的隐私,并为删除机制的未来提供了指导。
网络运动和物理情况的团结建模可改善对访客行为的预测原文标题: Joint Modelling of Cyber Activities and Physical Context to Improve Prediction of Visitor Behaviors地址: http://arxiv.org/abs/2008.11400作者: Manpreet Kaur, Flora D. Salim, Yongli Ren, Jeffrey Chan, Martin Tomko, Mark Sanderson摘要: 本文通过使用匿名(选择加入)的Wi-Fi关联并浏览购物中心运营商记载的日志,研究了大型室内购物中心用户的网络物理行为。我们的分析讲明,许多用户的网络运动与身体状况之间存在高度相关性。为了找到这种相关性,我们提出了一种机制,该机制用DBPedia观点中的富厚分类信息对物理空间举行语义标志,并盘算表现用户与购物中心情况的运动的情况相似度。
我们演示了两种情况下网络物理上下文相似性的应用:用户会见意图分类和未来位置预测。实验效果讲明,使用上下文相似性可以显著提高此类应用法式的准确性。MetaMetaZipf:对都会规模漫衍的分析有何配合点?原文标题: MetaMetaZipf. What do analyses of city size distributions have in common?地址: http://arxiv.org/abs/2008.11473作者: Clémentine Cottineau摘要: 在本文中,我对有关齐普夫都会定律的履历文献举行了语篇和语境分析。
在以前公然的荟萃分析质料的基础上,我收集了以英文揭晓的66篇科学文章的全文和参考书目,并构建了它们所用术语以及所引用的参考文献和学科的相似性网络。在66篇文章中陈诉的Zipf预计值漫衍的相似性网络模型中,我将这些网络用作解释变量。我发现作者经常使用的单词的靠近度与其陈诉相似值和Zipf预计值的离散趋势呈正相关。文章的参考框架也发挥了作用,因为引用相似参考文献的文章倾向于陈诉相似的Zipf预计平均值。
作为对以前的荟萃分析的增补,本方法阐明晰发动起来陈诉都会规模漫衍的科学文本和配景。它可以识别出语料库中的空缺以及可能被忽略的文章。协调的容量扩展问题中的近似能流和传输损耗原文标题: Approximating Power Flow and Transmission Losses in Coordinated Capacity Expansion Problems地址: http://arxiv.org/abs/2008.11510作者: Fabian Neumann, Veit Hagenmeyer, Tom Brown摘要: 随着可再生能源份额的增加以及需要正确评估输电,存储和部门集成之间的折衷作为平衡选择,在能源系统模型和详细的潮水研究之间架起一座桥梁变得越来越重要,但在盘算上却具有挑战性。
W比力了线性容量扩展问题中两个非线性现象(功率流和传输损耗)的近似值,这些问题配合优化了发电,存储和传输基础设施的投资。我们评估了差别的流量表现形式,讨论了投资决议,节点价钱,优化流量和模拟交流电源流量损失的偏差以及盘算性能方面的差异。通过使用开放式欧洲电源系统模型PyPSA-Eur,我们可以获得详细且可重复的效果,旨在促进选择合适的潮水模型。思量到庞大性的差异,最佳选择取决于应用法式,用户可用的盘算资源以及所思量的空间细节级别。
只管常用的运输模型已经可以在盘算上体现出高成本效益的系统的关键特征,但由于缺乏物理网格表现,因此在高负荷条件下仍存在缺陷。此外,忽略传输损耗会将最佳电网扩展高估20%。在线性化的潮水方程中添加带有两个或三个切线的二次损耗的凸松弛,并思量到随着网络的增强,线路阻抗的变化足以在设计研究中充实表现潮水和损耗。
我们讲明,所获得的投资和调理决议具有足够的物理性,可用于交流电潮水的更详细的非线性仿真中,以便更好地评估其技术可行性。转换模型中消失的错误原文标题: Disappearing errors in a conversion model地址: http://arxiv.org/abs/2008.11696作者: David P. Fan (University of Minnesota, USA)摘要: 相同的基本微分方程模型已针对差别状态之间的种群成员的时间依赖性转换举行了调整。转换模型已在差别的情况下应用,例如盛行病学熏染,用于创新流传的巴斯模型以及用于舆论的意识形态模型。例如,该模型的意识形态版本可预测民众意见的变化,以回应说服性信息回溯到无限期的已往。
所有消息的丈量均带有误差,本章讨论了消息丈量中的误差如何随时间消失,从而使预测意见值逐渐不受已往的丈量误差的影响。使用形式统计,敏感性分析和自举方差盘算来讨论预测不确定性。
本章先容了丰田汽车制造商的意见时间序列的意识形态预测,这些时间序列是凭据两年半的逐日Twitter得分盘算得出的。在这段时间里,丰田突然受到了坏消息的打击,该模型可以准确地预测出丰田的良好态度随之下降而倒霉的看法则随之上升。新浪微博上多任务深度学习用户抑郁检测方法原文标题: A Multitask Deep Learning Approach for User Depression Detection on Sina Weibo地址: http://arxiv.org/abs/2008.11708作者: Yiding Wang, Zhenyi Wang, Chenghao Li, Yilin Zhang, Haizhou Wang摘要: 近年来,由于抑郁症的精神肩负,危及生命的人数迅速增加。在线社会网络(OSN)为研究人员提供了另一种发现抑郁症患者的方法。
可是,基于机械学习的抑郁症检测的现有研究仍保留相对较低的分类性能,这讲明在革新其特征工程方面存在显著的革新潜力。在本文中,我们在新浪微博(中国社区中活跃用户数量最多的领先OSN)上手动构建了一个大型数据集,即微博用户抑郁检测数据集(WU3D)。它包罗20,000多名普通用户和10,000多名沮丧用户,这两种情况均由专业人员手动标志并重新检查。通太过析用户的文字,社交行为和张贴的图片,总结并提出了十种统计特征。
同时,使用盛行的预训练模型XLNet提取基于文本的单词特征。此外,提出了一种新颖的深度神经网络分类模型,即FusionNet(FN),并同时使用上述提取的特征对其举行了训练,这些特征被视为多个分类任务。实验效果讲明,FusionNet在测试数据集上的F1-Score最高,为0.9772。
与现有研究相比,我们提出的方法对不平衡训练样本具有更好的分类性能和鲁棒性。我们的事情还提供了一种检测其他OSN平台上的抑郁症的新方法。
声明:Arxiv文章摘要版权归论文原作者所有,机械翻译后由本人举行校正整理,未经同意请勿随意转载。本系列在民众号“网络科学研究速递”(netsci)和小我私家博客举行同步更新。
本文来源:m6米乐官网入口-www.diantijiameng.com