【有点乱,空了看心情再整理】

  • 线性回归

  • 层次分析

  • 时间序列、灰色系统

  • 聚类

  • 图论

  • 不要一看到多因子就用神经网络模型,神经网络后续的解释性、拓展性都很差. 对引入的因子进行主成分分析、特征降维

  • 观察附件中数据,对 Drug Reports 列进行主成分分析。不妨设小于等于 5 的事件为小概率事件。运用 Exdal 操作除去小概率事件,重新生成新的可靠数据

  • 对分析得到的数据和合成阿片类药物和海洛因事件进行相关性分析。分析后再利用熵权法以及负反馈的原理在 MATLAB 环境下对所有相关因素和海洛因事件的影响度 y 进行综合熵权。

图片

亮点/思路/maybe 提示

  • 最优也可能代表一些更加深层的含义,比如渐近稳定性,实际上是描述有限时长内达到状态变量变化率 绝对值 近似“最”小
  • 发达和发展中国家,有必要重新建模型吗?还是略做修改?
  • 对之前建立的 ODEs 模型,重新建立 Lotka-Volterra 模型,使其成为两个集体之间的捕食者模型。对于这种发达国家一个系统,发展中国家一个系统,然后 coupled 在一起的情况,你可以讲出很多故事来。。。。特别是与非线性动力学相关
  • 全球地图,并且整点热力图 cover 上
  • 不同尺度之间的同一类模型,当然存在适应性的问题。尺度越大,系统约稳定, 状态变量 约容易扁平化;尺度越小,系统约脆弱,容易受到多方面因素的影响。故事讲起来,模型建起来。从第 1 到第 4 问,从参数是数学期望、 线性函数 、非线性函数,再到关于时间的函数,你总能找到一套又一套的说辞

注意

是否对赛题给出了满意的解读方式,并对赛题中可能出现的概念给予了必要的澄清;是否明确列出了建模用到的所有条件及假设,并对其合理性给出了解释或论证;是否通过对赛题的分析给出了建模的动机或论证了建模的合理性;是否设计出了能有效地解答赛题的模型;是否对模型给出了稳定性测试;是否讨论了模型的优缺点,并给出了清晰的结论;

模型的有效性如何评估?模型实用性方面也要考虑随时间推移而改变

该优化的就简化信息

  • a:微分方程 机理分析 预测。时间序列模型、遗传算法、神经网络、微分方程求解

  • b:多加练习规划类问题、优化类问题、图论问题、选址规划等等,积累多元分析法、遗传算法、贪婪算法、神经网络、元胞自动机等多种算法,模型中善于改变约束条件进行优化。 离散型的变量和建立离散模型,可以运用多元统计分析方法来分析,如聚类分析、主成分分析、因子分析

  • c 提供数据 掌握数据挖掘处理的相关方法,包括预处理、后处理等。模型、方法方面,可能主要集中在统计、模式识别

  • d:提供数据 Gephi 图绘 优化 划分移动空间阶段 逃生考虑弱势群体)(网络关系图的绘制是必备的技)聚类分析、Markov 链、Gephi 可视化。建模更多偏向灵活性高,但是用到的基本模型较为简单,例如对评价方法与不同的求权重方法的组合、以及选取指标的考虑等等。

  • e: 评价预测 数据难找
    2018 年 E 题是以气候变化影响国家脆弱性为背景,属于评价和预测类问题;

    2019 年 E 题是生态服务评估模型,加成本效益分析;

    2020 年 E 题需要指数表征塑料污染严重程度,也属于评价类问题;

    2021 年 E 题含有食品系统模型以及成本效益、可持续性模型。

    问题的灵活性非常大,例如生态服务评估模型的建立考虑的因素可以包括人类社会对生态影响的众多因素,如何合理的确定指标体系以及权重计算是需要考虑的。
    E 题应首先快速找到可用数据,然后搭建基本模型,再增加模型细节,并在解题中获得灵感

选题

d (operations research/network science (优化 划分移动空间阶段 逃生考虑弱势群体)(网络关系图的绘制是必备的技)聚类分析、Markov 链、Gephi 可视化。建模更多偏向灵活性高,但是用到的基本模型较为简单,例如对评价方法与不同的求权重方法的组合、以及选取指标的考虑等等。

e 可持续性

a 看大家 喜不喜欢建物理类模型

b 规划 指标类型

不要:———————— f政治 有图需要提取图信息的 数据量太大 登录外网查东西太多的 太简单的

看论文要总结亮点.。论文模板准备好没有

2016 ea

  • a 物理 热力学
    • b 时间 最佳方法 模糊综合评价
  • c 最优投资 主成分分析
  • d 预测 多层复杂网络
  • e 评价决策遗传算法、熵值法、线性回归模型、主成分分析
  • f

2017 dab

  • a 评估预测 位置数量

  • b 收费障碍的区域形状尺寸

  • c 自动驾驶协作车道情况

  • d

  • e 城市增长计划

  • f
    2018 d

  • a 海洋信号数学模型

2021

某一个 d

  • 我们量化音乐发展的方法是:社会网络分析、社区发现算法、社会网络中的信息传播模型
  • 了解和衡量先前制作的音乐对新音乐和音乐艺术家的影响:对之前的音乐和音乐家建立特征评价体系模型(主成分分析:降维、机器学习:层次聚类)来进行分析流派内和流派间音乐家的区别和流派内和流派间的特征、通过 LSTM 长短时间记忆网络来衡量时间上流派的演变
  • 通过音乐家社会网络中的顶点的度和子网规模大小衡量单一音乐家的音乐影响力,之前的音乐家的音乐影响力造成更多相似音乐特征的后代作品!
  • 通过歌曲特征(例如结构,节奏或歌词)之间的相似程度来衡量影响力
    使用社交网络分析模型创建一个(多个)有音乐影响力的定向网络

社会网络分析模型!

第一个网络是一个无权有向图,节点是影响者和追随者,由影响者指向追随者。

开发可捕捉此网络中“ 音乐影响力” 的参数

通过社区发现算法来探索音乐传播影响力的参数,可以识别出连接紧密的子网, 音乐影响力我们认为是图的节点的度和所属子网络规模大小的加权量化平均值。

通过创建定向影响者网络的子网来探索音乐影响力的子集。 描述此子网。 您的“音乐影响力”措施在此子网络中体现了什么?

经过社区发现算法之后,可以发现整体的音乐影响社会网络中,识别出了 16 个子网,可以发现网络中心节点的音乐影响力更大,同时子网络的整体音乐流派都和中心节点高度一致。

  • 社会网络分析(复杂网络模型)、社区发现算法
  • 主成分分析、层次聚类
  • 多元逻辑回归
  • 社会网络传播模型
  • LSTM 长短时间神经循环网络
  • 模糊综合评价法模型
  • 知识图谱

    第一步先进行数据处理,对表格里的数据进行检查,看是否存在有误信息。然后对 full_music_data 的数据进行归一化处理,便于后面的评价模型或者回归处理。
    对于第一问题目要求根据 influence_data 数据文件建立音乐影响力的定向网络关系,可以采用复杂网络分析的软件来建立影响者与追随者之间的关系,从而可以得到哪些音乐家的影响力较大。这里需要注意的是因为数据有点大,对于全网络很难看清楚,因此有必要取出其中的一个流派或者一个音乐家的小网络来进行说明,着重分析里面的相互影响的关系。
    对于第二问题目要求根据 full_music_data 数据文件进行音乐评价模型建立,因此可以采用聚类分析灰色综合评价神经网络评价等评价模型建立相应的音乐因素(包括特征,类型等所列的三种特性)与评价值之间的关系。通过对不同流派或者相同流派不同音乐家之间的评价值对比,来说明相似性问题。
    对于第三问主要是比较不同流派之间的相似性,根据第二问建立的评价模型增加一个时间维度,对不同的流派进行模型计算分析,从而得到不同流派对应的评价值,进行相似度比较。通过对评价模型的回归分析,可以发现不同流派可能对应的系数权重和主要因素略有不同。因此从权重系数上可以对比从而到哪一因素是主要的区分因素。以及从评价值上分析不同流派之间的关联。
    对于第四问根据建立的相似度模型对不同的音乐家进行模型计算,并根据第一问的结果进行对比分析,说明影响者对追随者的影响。对于具体哪个特征的影响比较大,可以通过不同的因素的权重系数来进行说明,以及计算不同音乐家之间的系数权重来看一下是否都满足这一要求。
    对于第五问主要是建立音乐发展的时间模型,可以根据音乐评价模型或者流派流行程度与时间维度进行建立相应的时间模型。这里主要考虑音乐发展革命的定义,可以考虑设计指标来衡量相邻年份之间的关系,如计算不同年份的评价模型的系数权重的变化情况,从变化情况来看是否出现变革性的发展。对于哪些音乐家可以考虑之前的第四问来衡量不用音乐家之间的因素权重变化情况。
    对于第六问可以在第五问的基础上建立,流派或者音乐家随时间的发展模型,并进行相应的分析评价。也可以采用图论的方法在第一题的基础上采用子图进行分析。
    对于第七问主要是在前几问的基础上,对时间轴上的重大变化进行分析,并查找到相应的事件。
    最后根据上述的回答求解对音乐影响的价值进行分析,写好最后的备忘录。

  • 2020

题目 a

全球海洋温度影响某些海洋生物的栖息地质量。当温度变化太大以至于无法继续生长时,这些物种便开始寻找其他更适合其现在和将来的生活和生殖成功的栖息地。在美国缅因州的龙虾种群中就可以看到一个例子,该种群正缓慢地向北迁移到加拿大,那里较低的海洋温度提供了更合适的栖息地。这种地理上的人口转移会严重破坏依赖海洋生物物种稳定性的公司的生计。

您的团队已被苏格兰北大西洋渔业管理协会聘为顾问。如果全球海洋温度升高,该财团希望更好地了解与苏格兰鲱鱼和鲭鱼可能从苏格兰附近的当前栖息地迁移有关的问题。这两种鱼类代表了苏格兰渔业的重要经济贡献。鲱鱼和鲭鱼种群位置的变化可能会使以苏格兰为基地的小型捕捞公司在经济上不切实际,因为这些捕捞公司使用不带船上制冷装置的渔船来捕捞鲜鱼并将其运送到苏格兰渔港的市场。

要求

建立一个数学模型,以识别未来 50 年内这两种鱼类最可能的位置,假设水温将发生足够的变化以致种群迁移。

根据海水温度变化发生的速度,使用您的模型预测最佳情况,最坏情况以及最可能经过的时间,直到小型渔业公司继续捕捞这些种群将使小型渔业公司无法收获为止在其当前位置之外进行操作。

根据您的预测分析,这些小型捕捞公司是否应该改变其经营方式

a. 如果是,请使用您的模型为小型捕捞公司识别和评估实用且经济上有吸引力的策略。您的策略应考虑但不限于现实的选择,包括:

将部分或全部捕捞公司的资产从苏格兰港口的当前位置迁移到两个鱼类种群都移动的附近;

使用一定比例的小型渔船,这些渔船可以在没有陆上支持的情况下运行一段时间,同时仍确保渔获物的新鲜度和高质量

您的团队可能会识别和建模的其他选项。

b. 如果您的团队拒绝进行任何更改,请根据建模结果来说明拒绝的原因,因为建模结果与您的团队所做的假设有关。

使用您的模型来解决如果有一部分渔业移至另一个国家的领海(海域)时您的提案受到的影响。

除了您的技术报告外,还要为 Hook Line 和 Sinker 杂志准备一到两页的文章,以帮助渔民了解问题的严重性以及您提出的解决方案将如何改善他们的未来业务前景。

Problem

One-page Summary Sheet

某一个

https://blog.csdn.net/hroukie/article/details/104434007

  • 时间序列模型,二维位置 温度差
  • k-means 聚类,讲捕鱼点位置聚类。再单目标 多目标优化转为目标优化模型。自己定义了捕捞效益这一变量,来衡量每一年中 case 的好与坏
  • 敏感性分析:每次的迁移量系数(第一问模型中的 k)

2001334

  • 三个模型:模型 I:海水温度预测模型;模型 II:鱼类迁移预测模型;模式三:渔业公司盈利评估模式

  • 对于模型 I,首次收集 1960 年至 2019 年的全球海洋温度数据。然后,通过对数据内在趋势的分析和平稳性的验证,验证了 ARIMA 模型预测温度的有效性。然后利用历史数据拟合 ARIMA 的参数,引入 k 次交叉验证,将最终预测模型确定为 ARIMA (1,1, 0) 。最后根据 ARIMA(1,1,0)方法,采用 Bootstrap 方法对 10000 种可能的预测实例进行了模拟,为预测鱼类的迁移提供了很好的基础。

  • 模型一:建立了相应的经验方程来确定温度对鱼类洄游的影响,基于模型 I 中 bootstrap 方法生成的 10000 个温度变化样本,模拟每个样本的迁移情况,以确定鱼类最可能的位置。

  • 模型三:渔业公司的利润评价方程是根据经济学原理确定的,所涉及的参数是通过引入实际的管理数据来估算的

  • 鲁棒性和灵敏性分析:鱼类的初始分布。影响模型、社会利润率和渔船航行半径的因素

  • data clearning:去除缺失值 无效值

  • 在数据集上应用球坐标来表示点。为了获得地图中的真实距离关系,我们将观察到的地图区域近似为平面四边形。在使用测地线方程 (GRS80 球) 求解四边形长度后,我们拟合一个投影变换,得到球坐标和平面坐标之间的对应关系。这样,点之间的欧几里得距离大约是球面上的测地线距离图片

  • 温度变化图图片

  • OLS method:最小二乘回归。。。,OLS 方法可以用来估计公式的参数。需要注意的是,模型中存在滞后阶和差阶,因此我们需要对模型的估计结果进行 k 倍交叉验证,并在给定的备选模型中找到预测效果最好的模型。

d

2019d—1902407 Dijkstra 基于目标规划的同层动态调度算法和异层动态调度算法

实际可用逃生点只用工作人员知道。适应性模型,解决各种潜在危险,可能每种威胁会不同程度的影响逃生路线

首先建立了总疏散时间最短的目标规划模型,以保证建筑物内人员安全、快速疏散。该模型将疏散时间划分为房间通道移动阶段、上下建筑阶段、进出阶段和事故发生阶段。通过对每个阶段进行优化,实现了总时间最小的目标。并对 Dijkstra 算法进行了改进,找到了从每个房间到出口的最有效路径。另外,根据目标规划,提出了同楼层之间的动态调度算法和不同楼层之间的动态调度算法来解决拥堵问题。此外,针对弱势群体的不同特点设计了有针对性的应对策略,以减少事故的发生

  • 不难看到在这篇优秀论文里除了常规的规划模型之外,还巧妙地通过划分移动空间阶段、优化图论算法、对每个阶段都进行优化来达到更为精确和先进的优化方式。并且充分考虑了弱势群体的因素进行策略讨论。

  • 模型不算高端但是应用的非常充足和合理,加上好看的排版和示意图,让这篇文章脱颖而出

  • 该模型将疏散时间划分为房间通道的移动阶段、上下建筑阶段、进出阶段和事故发生阶段。优化每一个实现总时间最小

  • 为了获得最优路径,我们改进了 Dijkstra 算法

  • 提出了一种基于目标规划的同层动态调度算法和异层动态调度算法。

  • 此外,我们针对易感组的不同特点设计了针对性的反应策略,以减少事故。

  • 与随机算法相比,该算法节约了多少时间,损伤减少多少

  • 将灾害因素纳入模型中,进一步提高了模型对不同灾害的适应性,并考虑了应急人员进入建筑物的安排

  • 在不影响最长疏散时间的情况下,可获得每个交叉口可输入的最大应急人员数量

  • 此外,本文提出的模型还对其他大型多层公共建筑进行了探索,并给出了模型改进方案。
    图片

  • 对卢浮宫应急管理的政策和程序、其他大型拥堵结构如何调整和实施模型以及模型在不同灾害下的表现

  • 图片
    图片

  • 由于人群的逃逸速度不均匀,此处采用平均速度

  • 由于楼梯的流动限制,虽然一些路线是最短的,但由于拥塞队列,它们并不是最佳。因此,当使用 Dijkstra 找到最短路径时,应避免可能拥塞的位置

  • 图片

  • 动态调度。调度策略的总体目的是最小化拥塞时间(以更快的疏散)。当所有路线上的人聚集在一个地点时,该地点的人数为图片

  • 图片

2020d

题目:

  • 还要考虑整个奥运会的其他结构指标和网络属性.探索多个尺度,例如,但不限于,在观察互动时,微观(成对)到宏观(所有球员),以及时间,如短(分钟到分钟)到长(整个比赛或整个赛季)。还需要确定反映成功团队合作(除了得分或胜利之外)的绩效指标,例如比赛类型的多样性、球员之间的协调或贡献的分配。

  • 这些因素可能包括团队是否具有多种技能(一个人可能很快,而另一个人很精确),团队在个人绩效与集体绩效之间的平衡程度(明星球员可以帮助利用其所有队友的技能),以及球队在一段时间内有效协调的能力(一名球员从对方手中抢断球,另一名球员准备进攻)。目标不仅是检查直接导致得分的互动,而且还探索整个比赛以及整个

  • 任务:

    • 网络图
    • 成功合作的绩效指标。,例如比赛类型的多样性,球员之间的协调或贡献的分配。您还可以考虑其他团队级别的流程,例如适应性,灵活性,节奏或流程。弄清策略是否是重要的具有普遍效力或取决于对手的反战略。团队工作的结构,配置和动态
    • 告知哪种类型的结构策略 有效。团队应作出的变化
      如何设计更有效的团队?开发团队绩效的通用模型还需要捕捉团队合作的其他哪些方面

2020d-scut 刘老师讲解

  • 按区域分图片

2020d-2002526

    1. 整个网络,本地网络和各个网络的角度分析了特定的网络特征。整个网络:加权接近矩阵,质心,加权中心色散和最大半径。本地网络:识别网络模式,包括核心/外围分析,以获取核心/外围分析,以获取核心播放器和外围播放器及其关系,以及构建三节点子网的配置分析,以获得其图案的类型和频率,即 Dyadic 和 Triadic 的具体配置。个人网络的指数:节点的程度中心。绘制时间表。
    • Network Analysis
    • 玩家的重要性与玩家传球的次数正相关
    • 每个节点的位置取决于其平均位置,即每个球员传球的坐标的平均值
    • 整个网络:结构指标和网络属性包括加权邻接矩阵 [2] 、网络质心(平均位置) [2] 、加权质心离散度和网络的最大半径(每个玩家与网络的网络质心之间的距离之间的最大值)
      • 加权邻接矩阵,球员 i 对球员 j 的传球次数
      • 加权质心离散度:(替补球员传球次数很少,但简单的标准差会让他们获得与其他传球次数多的球员相同的权重,这对于足球传球网络的离散度来说没有意义)
    • local network
      • 分节点 core node and edge node 核心节点 边缘节点

      • Ucinet software 软件

      • core-periphery analysis

      • 玩家的位置、链接厚度和链接数量。

      • 在生物学中,MOTIF 用于解释蛋白质的空间结构。这里可以用于足球传递网络的分析,以获得团队的本地配置
        The higher the connectivity of the 3-node network, the higher the flexibility of the three-way configuration of passing, rather than a fixed passing pattern.

      • R software was used to calculate the occurrence frequency of each motif of a team in a game, and the commonly used motif type of the team could be obtained.

    • 个人网络
      • 中心地位越高,他参与传球的次数就越多
    • 传球时间线可以反映游戏的动态过程,即传球总数随时间的变化
        1. 绩效指标:一个队在一场比赛中的传球总数、对球队的平均贡献率和传球占有率,以及四个队级过程:聚合、扩展和,速度和连接配置比率。多元线性回归分析。团队:结构、配置和动力学
    • CV coefficient of variation
    • 中场人数的比例除以每场比赛的核心玩家数量,以衡量“团队的通过权能力”的掌握率
    • 引入加权标准来反映整个比赛中队员的分散性。它可以衡量一个团队是否能够在允许的时间内在球场上的不同位置传球,因此可以使用加权标准来描述接球的聚集。当球员少集中在球场上时,在整个球场上控制球的能力将会更强
    • select the time that 完成前 50 次传球,代表球队的节奏。时间越短,比赛开始后球队持球和快速传球的次数就越多
    • 第一个问题的分析得出了 26 个双方球员配置模型 motif12 和 motif13,其中连接的配置模型 motif12 和 motif13 出现的频率更高。我们将连通配置比定义为两个连通配置模型的频率之和与总配置模型的频率之和之比,作为反映博弈中小组间沟通程度的灵活性
    • fig8 散点图得出结论?????????
    • 多元线性回归
      • 对于回归第一步舍弃的指标,应进一步探讨它们与因变量之间的关系。
    • 计算三个变量的方差膨胀因子(VIF),结果如图 10 所示,说明模型中不存在与自变量的多重共线性问题。进一步可以认为,该模型中的指标可以从不同方面反映团队的合作水平。
    • 团队的策略主要包括人员的布置和沟通的安排。在所选取的指标中,延伸度代表团队的岗位安排,正向效应显著;连通性配置比代表团队的沟通安排,正向效应显著,整体模型显著。因此,该策略一般是有效的,无需考虑对手的反策略现象。游戏失败的原因可以用缺少指标来解释
    • team passing network
    • team configuration is defined as uneven distribution of the number of passes and players’ abilities, which can be explained by the connected configuration ratio
    • Dynamic is the introduction of time to observe the team’s performance between the time segments of each game and between multiple games

2020d-2003723  在摘要中把模型 AHP 等标黑+总结优点+描述假设并解释假设合理性+heterogeneous+凑字数的能力??
图片

  • 网络——利用该传球网络,不仅可以识别常见的传球模式,还可以找出经典的足球评价指标和属性指标,并将结果可视化展示。
    • 传球次数设置为权重
  • 参考基因编码类型区分二元和三元结构
    • Therefore, in football, the clustering  coefficient is used to coordinate the triangular relationship among the three players.
      • 为了明确个人对团队的贡献,本文将主观权重和客观权重相结合,采用层次分析法和熵权法构建球员得分子模型——将层次分析法和熵权法相结合,得到不同位置和动作类型对结果的不同权重,形成计分规则,评估每个队员的贡献,进而分析每个队员在每场比赛中的贡献分布
    • 将玩家得分的均值和标准差纳入回归模型的变量中。队员的平均得分代表队员的总体贡献水平,队员得分的标准差代表队员贡献水平的分布。这两个指标解释了团队中个体绩效的一般水平和差异,反映了团队成员的影响力
    • 常见的阵型是 4-3-3、4-4-2 等。我们把阵型分为三种:进攻型、防守型和球场平衡型。根据这三种类型的地层构造分类变量,并将其纳入回归模型的自变量中。
  • 在异质性分析方面,我们从输赢情况和得分结果两个层面建立多分类无向 logistic 回归模型来区分团队队形 multi-classification undirected logistic regression
    • 根据不同阵型的对手,将整个数据集划分为 3 类较小的数据集(进攻型、防守型、球场平衡型),并分别进行回归
    • 对手主要采用攻守平衡阵型时,如果我们选择攻守平衡阵型,对比赛结果没有显著影响。如果选择防守类型,获胜的概率是进攻类型的 19%。⚫当对手主要采用平衡的攻防阵型时,如果我们选择防守阵型,对比赛结果没有显著影响。如果你选择球场平衡型,获胜的概率是采用进攻策略的4倍
    • 得分是指根据上面构建的得分子模型对球队中球员得分的标准差,反映了球队中球员贡献的分布情况。也就是说,在其他条件相同的情况下,团队成员的贡献分布越分散,团队的绩效越好
    • 聚类系数可以扩展到团队成员之间的交流频率。团队成员不应该尽可能频繁地交流。他们应该注意沟通的效率
  • 在我们为团队建立的合作模型中,我们只考虑了参与者的位置和行动,参与者之间的互动,以及部队的安排,却缺少了领导力和团队文化的维度。玩家还有性别、个性、稳定性和其他未被考虑的因素。
  • 缺点:样本量小。根据模型的使用条件,数据量优选为施工指标的 10 倍以上。但由于本文的数据有限,结果可能不稳定,需要在收集更多可靠的数据后进一步考虑。⚫两个参与者之间的交互分析相对简单。在网络建设等分析中,由于难以对双方的瞬时位置进行量化,且没有考虑对手的障碍,我们将在获得更精确的GPS数据后进行分析。。。。如指标选取过程中的局限性、难以量化队友的瞬时位置、无法获得对手的阻挡程度等。这些都需要在扩大指标数量和样本量的基础上进行深入研究

# 2021年 美国大学生数学建模竞赛 赛题发布!【英文原文 & 中文翻译】 2021 题目

图片

2021d-知乎

  • 相互影响力权重以及影响力评价指标体系有多种定义方法
  • 由于数据量大,可以先使用 R 型聚类分析、主成分分析的方式降维
  • 相似度。我们是否可以使用求均值的方法判断不同的流派是否对相似度有影响?忽略偶然因素是可以这样的,但是我们也可以从概率统计的角度考虑进行显著性检验。进行显著性检验,得出不同流派对音乐的相似度有显著性影响的结论
  • 对时间轴进行处理
  • 流派相互影响矩阵,画出热度图。
  • 流派的区别: 聚类

2021d-2100112

  • 度中心,加权度中心和尖端中心——综合指标-影响力

  • 主成分分析预处理数据以减少 dimension 和 collinearity。距离——相似性。通过计算平均相似性,我们申请Mannwhitney测试。图片

    • 为了探讨同一流派的艺术家是否比不同流派的艺术家更相似,我们构造了 Mann-Whitney 假设检验(画图 fig4)。与传统的双样本 t 检验相比,Mann-Whitney 统计量的有效性不需要分布假设。在这一问题中,音乐在体裁内和体裁间的相似度分布与常态相去甚远。因此,这一统计数据将带来更好的结果
    • 我们计算了不同流派中每个音乐人物的绝对变异系数,以量化流派内部某些特征的变异。
  • 区分类型。通过分析不同时期的流域数量,我们探索了流派的演化路径。classification tree图片

  • 相似性贝叶斯网络,以识别基于轨道中的音乐特征性相似性的真实追随者。然后我们应用多变量的两个样本均值测试,发现任何音乐特征都没有比其他音乐特性更为“传染性”的证据(p 值> 0.1)

      • 基于渐近分布,我们可以计算任意两位艺术家之间的相似性分数,然后构建一个相似性贝叶斯网络。然而,这种遍历算法存在 NP 问题。因此,我们使用随机启动的爬山算法
  • 多变量双样本检验Central Limit Theorem and Slutsky Theorem:。分析了流派的上升和衰落,并在 20 世纪 50 年代找到了音乐革命。我们提出了一种动态编程算法,可以检测与革命一致的音乐特性中的变化点。我们的研究结果表明,声学,能源,水平和响度可能会表示革命。

      • 由于音乐特征的数量 (p = 9) 远小于样本大小,我们不需要对数据进行任何分布假设。
  • 为了进一步了解流行/摇滚音乐的演变,我们根据整个流派音乐特征的滞后趋势,提出了一个动态影响指标。从 20 世纪 60 年代到 2010 年代,共有 10 位动态影响者,每一位都对这一流派产生了独特的影响。此外,我们还解释了流行/摇滚的演变。

    • -DP algorithm
    • 在给定变点数时,采用动态规划算法的关键是建立新变点加入前后残差平方和的递推关系
    • BIC criterion
  • 基于时间序列分析检测出三个重要的时期,这表明了音乐的文化影响。然后查相应文化背景。。根据建立的模型,我们确定了反文化运动等社会变革和互联网扩散等技术变革。。在不同的时间或环境中,几种文化对音乐产生了影响

    • two types of revolutionaries: artists who make a major change to existing genres and artists who create a new genre.

    • 图片

  • 图片
    图片

  • Degree Centrality:number of edges from node

  • 图片

  • 2021d-2100242(相似度|遗传)

  • pagerank 算法 通过这个模型,我们寻找了具有高流动性的节点,并获得了前 20 名流动艺术家,top 20 influential

  • 建立了基于向量距离的相似度模型。艺术家之间的相似度. 结果表明,大多数艺术家与同一类型的艺术家具有高度的相似性,但少数艺术家与其他类型的艺术家具有高度的相似性

  • 区分不同流派关系,分析流派变化方式。 音乐特征继承度指标,某些更有感染力。遗传模型 传染性 影响力。结合两个模型。 证明“影响”是否对“相似性”有效.

  • 根据音乐特征分析音乐主要变化随着时间。分析社会环境对音乐的变化
    ——————————————————————————————

  • 建立模型来衡量音乐影响。音乐影响可以用三种方式来衡量。首先,艺术家受到其他艺术家的影响。其次,新音乐被以前产生的音乐所影响,这可以从以前和新音乐之间的相似性中看出。第三,音乐随着时间的推移因社会或技术事件而变化。

  • 图片

  • 子网络和总网络 结论:无论是在子网络还是整个网络中,流动艺术家都将凭借公关脱颖而出。

2021d-2107091

社交网络分析,滑动窗口, 无标度网络, 帕累托法则,PageRank, 特征组合

  • 删掉在两个数据集不共享的人。删掉合唱的歌曲数据

  • 影响:流派跨度和时间跨度
    图片
    图片

  • pagerank图片

    • 社会网络分析(SNA)。计算网络中音乐人的点度中心性,并进一步使用 PageRank 修正的 Eigenvector Centrality,对音乐人的音乐影响进行评价,

     

  • 满足 Pareto’s Principle(二八定律)。较少数的音乐家影响绝大多数音乐家。

  • SNA 分析方法

  • 2: 使用余弦相似度与欧几里得相似度,从音乐的全局特征与局部特征两个维度进行全局相似性  和局部相似性  的衡量,并综合考虑流行趋势的影响因素,建立 Multi-dimensional Music Similarity Evaluation Model 用以衡量音乐的多维度相似度 

  • 图片
    图片
    图片
    图片

  • 局部相似性——同流派间的歌曲并不是在所有特征上都是相似的,可能只是在特定的方面具有相似性。为进权衡音乐在全维度和部分维度之间的相似性,我们从各特征入手,从微观角度探究音乐的局部相似性(节奏,情感倾向,乐器)

  • 衡量音乐相似度时,应该降低流行趋势对音乐本身的影响

  • 3: 为探究流派的显著性区分特征,我们将音乐特征进行随机组合,建立 Discrimination Evaluation Model of Feature Combination 来选择使得流派之间区分性最强的特征组合,作为流派的显著性特征。最终我们还在时间上对流派的变化进行了分析,将音乐的变化与社会环境联系了起来。(结合历史分析)

  • 4: 分别从影响者对追随者的长期与短期影响,考察追随者的作品和发表在追随者作品之前的影响者的作品,建立 Long-Short Term Influence Evaluation Model Based on Sliding Window 用以计算影响度评分 IDS,并确定影响阈值

  • 基于流派的音乐特征与流派的音乐家数目,将流派的变革分为现存流派革新和新流派的产生,建立约束方程来识别音乐变革点。并基于音乐变革点前后的  来识别音乐变革中的主要影响者 

  • 以 10 年为考察周期,基于 Task 4 中的 IDS,计算分析对象对流派内所有人的 IDS,加权求和得到动态影响者指标 DII,用于识别不同年代流派内的领军人物。最终我们从整体音乐行业、单独流派内音乐的特征、音乐的听众三个角度的变化来分析音乐与政治、文化、社会间的关系。

  • 灵敏性分析:MS 中字母’l’权重的不同可能会影响相似性的评价结果..

    • f 使用基于方差的灵敏度分析方法(Sobol 方法),研究多个超参数同时变化时对结果的影响。Sober 方法对参数在可行空间中的蒙特卡洛采样进行模拟,得到大量的输出。模型输出的方差是单个参数的所有阶方差的和。
  • 优点:SNA 理论构建了一个音乐家之间的影响网络,并用更充分考虑的指标来衡量网络的内部参数

    • 在分析有影响者是否真的对追随者有影响时,我们使用了滑动窗口时间序列方法来综合有影响者对追随者的短期和长期影响。
  • 不足:我们本可以更深入地分析某些问题,但由于篇幅的限制,我们的工作暂时只能做到这

    • 由于缺乏实际的数值参考,我们只能从实际情况中观察到模型的准确性,而不能通过数值方法来测量模型的准确性

e 粮食 环境(温室气体 生物多样性 森林砍伐 淡水使用 ) 人口增长

食品系统模型,以便能够对其进行调整以针对各个级别进行优化效率,盈利能力,可持续性和/或公平性

全球或本地的范围

•如果为公平和可持续性优化食品系统会怎样?该系统与当前系统有何不同?这样的系统实施需要多长时间

•改变粮食系统重点的收益和成本是什么?它们什么时候发生?这些收益和成本在发达国家和发展中国家之间有何不同?

•建立食品系统模型后,将模型应用于至少一个发达国家和一个发展中国家,以支持您的发现。

•讨论模型的可伸缩性(对较大或较小的食品系统)和适应性(对其他区域)。

我: 食物浪费-缺乏

2021e-知乎

•如果为公平和可持续性优化食品系统会怎样?该系统与当前系统有何不同?这样的系统实施需要多长时间?

•改变粮食系统重点的收益和成本是什么?它们什么时候发生?这些收益和成本在发达国家和发展中国家之间有何不同?

•建立食品系统模型后,将模型应用于至少一个发达国家和一个发展中国家,以支持您的发现。

•讨论模型的可伸缩性(对较大或较小的食品系统)和适应性(对其他区域)。

2021e-2102057 logistics 三个环境指标 对动物产品征税来调整结构 政府援助

  • 环境-公平-经济模型 consists of three interlocking sub-models 环境可持续性模型、食品公平分配模型和经济效益-成本分析模型
  • 1
    • 环境模型涉及三个环境指标,即粮食系统的温室气体(GHG)排放和富营养化排放以及粮食生产的土地使用
    • 经过大量的数据分析,我们发现改变国民的饮食构成对上述三个指标的降低有显著的影响。
    • Logistic 模型来预测未来的情况,并引入时间系数 r 来衡量实现环境可持续性所需的时间
    • 与植物产品相比,提供同样的蛋白质和卡路里,动物产品通常会排放更多的温室气体、更多的富营养化物质,占用更多的土地。因此,我们可以通过提供更多的植物产品和更少的动物产品来改变国民的饮食构成,从而实现食品系统的环境可持续性。政府可以通过对动物产品征税来推动这一调整。表示税率为 T, T∈[0,1]。这将提高食品生产商的经济成本,因此他们将生产更少的动物产品,并逐渐改变国民的饮食结构。
      • 2: 公平模型 粮食分配不平衡。援助因子 A 用于衡量政府援助的强度。至于运费,政府可以向食品生产商和分销商收取食品权益税。
    • 为了降低饥饿率,我们可以让转基因食品不安全人口的增长速度小于人口的增长速度。将 A 表示为“援助因子”来衡量政府援助的程度,A 越大,政府援助的强度越大,减少饥饿率的时间越短。
  • 3: 经济模型考虑了食品生产者和分销商的净利润。在我们的再优化食品系统模型中,经济净利润不仅仅是效益和成本之间的差值。它需要包括第一 E 模型和第二 E 模型的动物产品税和食品权益税
    • 认为在食品系统中有三种主要的经济成本,包括材料、土地和劳动力。然后我们假设这三种成本与粮食产量呈线性关系,斜率为原材料、劳动力和土地的价格

    • 在我们的改良食品系统中,食品生产者和分销商都只是销售者,我们忽略了他们的金融活动,就像假设 2 中提到的,食品的价格是稳定的,

    • 们改进后的体系与当前体系的最大区别在于,通过在我们的模型中考虑环境和社会因素,并通过转变饮食结构和食品公平征税,我们将效率和盈利能力的优先级从优先级中移除

    • 考虑到中国国家综合实力,我们设定援助因子 A = 0.01,“动物产品税”T = 0.05

    • 图片

    • 发达和发展中国家区别: 利益差异:在发达国家,由于他们最初更喜欢动物性食品,因此改变粮食系统的优先次序有助于比发展中国家更大幅度地减少温室气体排放和富营养化排放。此外,由于发达国家的经济高度发达,他们有更大的援助因素,因此粮食不安全人口将比发展中国家更快地减少到零。成本差异:由于发达国家较高的动物产品税,他们的利润比发展中国家有更高的减幅

  • 灵敏性分析
    • 改变了植物性食品和动物性食品中特定食物的重量,即αi和βj。植物性和动物性食品的环境参数(GHEcal、veg、GHEcal、ani等)变化较小
  • 如我们之前提到的,在极度贫困的国家,人们严重缺乏动物性食物,改变饮食结构并不奏效。这就是我们模型的局限性。C 我们的模型的好处不会永远持续下去,它会随着人口的增加而减少,因此我们的模型可能需要为了长期发展而升级。最根本的方法是限制人口的过度增长。
  • 其中之一是改善农业生产方式,采取环境友好的方式。例如,无土栽培的优点是生产更多的高质量的食物,而不需要水、化肥和劳动力。然而,无土栽培由于投资大、生产管理严等原因,并不能广泛推广。但我们相信,随着农业技术的发展,这些对环境友好但对经济不利的农业生产模式总有一天会在全球推广,从而有助于建立一个更高产、更可持续的粮食系统。

2021e-2113869 BP model 描述生产模型 三个子系统(种植业、畜牧业和渔业) 发达救济发展 最小距离

  • 将整个粮食系统划分为三个子系统(种植业、畜牧业和渔业),并在每个子系统中引入影响生产的各种指标。其次,我们设计了一个公平分配模式来解决公平问题,在这个模式中,粮食过剩的国家将自愿补贴低收入缺粮国家(LIFDCs)。国家之间的补助

    • BP (back propagation)神经网络来描述生产模型。这里使用的神经元模型是 McCulloch 和 Pitts(1943)提出的“M-P 神经元模型”,图片

    • 气候 地形不同 农业科技指标 国家科技水平 等等带入模型 计算出各国的种植产值最大值

  • 美国需要支付 2055 万美元的运输费用,以援助最不发达国家海地和危地马拉。好处是美国可以经历环境改善。大气、水、土地的环境破坏都将得到缓解。

  • 图片

  • 图片

  • 实现可持续发展目标需要政府的介入。具体来说,对于生产过剩的国家,政府应该提出有效的政策来遏制生产过剩的现象。在种植业,政府可以要求农民降低种植密度,停止复垦土地。例如,中国政府提出了“退耕还林还草”的政策。同样的限制也适用于畜牧业和渔业系统。政府可以对过度放牧的农民进行惩罚,并为渔民设定捕鱼配额。对化学品使用的控制可能更复杂。化学制品是一把双刃剑。正确使用可以增加作物产量,但过度使用会造成环境破坏。

  • 如何确定哪个富裕国家应该帮助哪个贫穷国家?我们主要考虑的是运输成本。为了使运输成本最小化,我们设计了一个模型来保证捐献者和接受者之间的总距离最短

  • 通过分析影响一国捐赠的因素,我们定义了一国的粮食捐赠 F 函数,它有三个自变量:产值 V 值、GDP 增长率和国际援助项目参与率。

  • 无机污染和有机污染 具体化了怎么定义(其中 w1iw 为描述化学品对酸、碱、氧化剂、重金属等无机水污染的系数,w2iw 为化学品对有机水污染的系数,主要包括有机毒物。土地污染类似于水污染,由两个因素来评价:无机污染和有机污染。其中 w1il 是描述化学品无机土地污染的系数,主要包括重金属污染和放射性元素污染;w2il 是描述化学品有机土地污染的系数,如农药。以美国为分析对象,T 表 3 为系数,F 图 26 为不同行业的环境缓解百分比。b.限制生产过剩)

  • 可以看出,该模式在小区域国家的表现较好。主要原因可能是数据在小范围内可以更好地描述国家的独特特征,或者说是在大范围内很难获得准确的数据。与面积小的国家相比,面积大的国家具有多区域特征。例如,在种植生产模型中,我们将气候和地形作为影响因素。然而,对于幅员辽阔的国家来说,它们可能涵盖不止一种地理特征。

假设

2019d

图片