人口迁移问题最小二乘法问题基因距离表示解读.docx
- 文档编号:23410312
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:12
- 大小:163.61KB
人口迁移问题最小二乘法问题基因距离表示解读.docx
《人口迁移问题最小二乘法问题基因距离表示解读.docx》由会员分享,可在线阅读,更多相关《人口迁移问题最小二乘法问题基因距离表示解读.docx(12页珍藏版)》请在冰豆网上搜索。
人口迁移问题最小二乘法问题基因距离表示解读
1.人口迁移问题
假设有两个地区——如南方和北方,之间发生人口迁移。
每一年北方50%的人口迁移到南方,同时有25%的南方人口迁移到北方,直观上可由下图表示:
问题:
如果这个移民过程持续下去,北方的人会不会全部都到南方?
如果会请说明理由;如果不会,那么北方的最终人口分布会怎样?
解:
首先进行假设,假设最初北方的人数为N,南方的人数为S,移民过程持续下去,最终北方的人数为X,南方的人数为Y。
因为移民过程一直持续,我猜想最终南北方的人数应该达到一种平衡,从南方转移到北方和从北方转移到南方的人数应该恰巧相等,而且其中的南方人和北方人的人数也相等,首先对结果进行大胆猜想:
X=1/3(N+S);
Y=2/3(N+S);
小心求证:
从第1年开始北方人数为Ni,南方人数为Si,i为年份,可以得到下表
年份
0
1
2
3
4
北方人数
N
N1=0.5N+0.25S
N2=0.5N1+0.25S1
N3=0.5N2+0.25S2
……
南方人数
S
S1=0.5N+0.75S
S2=0.5N1+0.75S1
S3=0.5N2+0.75S2
……
假设每年北方和南方的人数为向量αi=[NiSi]T,i为年份,可以得到以下式子:
αi+1=[
]αi,其中i≥0;
由上式得出:
α1=[
]α0;
α2=[
]α1=[
][
]α0=[
]2α0;
α3=[
]α2=[
][
]2α0=[
]3α0;
……
随着移民过程一直持续下去,得到最终南北方人数为
αn=
[
]nα0
最终需要求解矩阵A=[
]的n次幂,首先求出矩阵A的特征值,|λE-A|=0,解得矩阵A的特征值为λ1=1/4,λ2=1,对应的特征向量为β1=[12]T,β2=[1-1]T,令P=[
],则P-1AP=[
],因此A=P[
]P-1。
因此得到
An=
(P[
]P-1)n=P
[
]nP-1=P[
]P-1=
[
][
][
]=[
]。
最终南北方人数为
αn=[
]α0=[1/3(N+S)2/3(N+S)],即最终北方人数为1/3(N+S),南方人数为2/3(N+S),其中N,S为初始北方和南方人数。
2.最小二乘问题
一颗导弹从敌国发射,通过雷达我们观测到了它的飞行轨迹,具体有如下数据:
水平距离/m
0
250
500
750
1000
高度/m
0
8
15
19
20
我国军情处分析得出该导弹沿抛物线轨道飞行。
问题:
预测该导弹在什么水平距离着地。
解:
一颗导弹从敌国发射,我们通过雷达观察到了导弹的飞行轨迹及具体数据,我国军情处分析出该导弹沿抛物线轨道飞行。
在我们学过的高中数学知识中可以得知,抛物线的函数方程为
高中学习的知识使我们知道只要得到抛物线上3个点的坐标,我们就可以将抛物线的方程求解出来,题目中的数据给我们提供了5个点。
首先选取前3个点对抛物线的方程进行试求:
点1(0,0),点2(250,8),点3(500,15),将上述3点坐标带入抛物线的方程中得到方程组:
c=0;
22500a+250b+c=8;
250000a+500b+c=15;
解方程组得:
a=-0.000004878048780;
b=0.032439024390244;
c=0;
在MATLAB中作出该抛物线方程的图像,以及题目中表格中数据如图所示
由图像我们可以看出,该函数曲线与题目中的数据相比,除了点1,点2,点3在该曲线上,剩余两点均距离曲线较远,并且剩余两点没有均匀分布在曲线的两侧。
如果在题目中的点任意选择3点,将会存在一共有C
=10种选取方法,但是每一种方法都不会将题目中5个点的数据都利用起来,得到的结果也不准确。
如何将题目中的每个点的数据都利用起来,得到一个更确切描述该抛物线的方程,是本报告题目的内容:
利用矩阵的范数解决曲线拟合问题,该方法也称为最小二乘法。
首先设定该抛物线方程式为
将x的值分别带入该方程式得到一组数值:
c,62500*a+250*b+c,250000*a+500*b+c,562500*a+750*b+c,1000000*a+1000*b+c,
假设
G=
[c,62500*a+250*b+c,250000*a+500*b+c,562500*a+750*b+c,1000000*a+1000*b+c],
向量y=[08151920],
P=G-Y=
[c,62500a+250b+c-8,250000a+500b+c-15,562500a+750b+c-19,1000000a+1000b+c-20],
下面求向量P的2范数,
J=||P||2=1382812500000a2+3125000000ab+3750000ac-69875000a+1875000b2+5000bc-87500b+5c2-124c+1050,
当向量P的2范数取最小值时,有最优解。
将J对a,b,c,求偏导数得
Ja=2765625000000a+3125000000b+3750000c–69875000;
Jb=3125000000a+3750000b+5000c–87500;
Jc=3750000a+5000b+10c–124;
令Ja,Jb,Jc=0,取极值,解得:
a=-0.000019428571429;
b=.0398********;
c=-0.228571428571423;
最终解得抛物线方程为:
在MATLAB中绘制该抛物线方程和各个坐标点:
可见该抛物线方程正好处在各个点的附近,没有单一方向的偏差,完整的利用5个点的坐标,良好的解决了这个问题。
令y=0,得
x1=5.7550372370504140600543712713625;
x2=2044.2449627177069388821200988843。
即炮弹最终在2044.24米处降落。
MATLAB解决该问题的程序如下:
formatlong
x=0:
250:
1000
y=[08151920]
symsabc
G=a.*x.*x+b.*x+c
P=G-y
J=sum(P.^2)
Ja=diff(J,a)
Jb=diff(J,b)
Jc=diff(J,c)
A=[276562500000031250000003750000;312500000037500005000;3750000500010]
B=[6987500087500124]
C=B/A
g=-0.000019428571429*x.*x+0.039828571428571*x-0.228571428571423
plot(x,y,'r*')
holdon
plot(x,g)
holdoff
legend('数据点(x,y)','拟合曲线f(x)=-0.000019428571429*x.*x+0.039828571428571*x-0.228571428571423'),
xlabel('x'),ylabel('y'),
title('实验数据点(xi,yi)及拟合曲线f(x)')
solve('-0.000019428571429*x*x+0.039828571428571*x-0.228571428571423=0','x')
程序结果如下:
x=02505007501000
y=08151920
G=[c,62500*a+250*b+c,250000*a+500*b+c,562500*a+750*b+c,1000000*a+1000*b+c]
P=[c,62500*a+250*b+c-8,250000*a+500*b+c-15,562500*a+750*b+c-19,1000000*a+1000*b+c-20]
J=1382812500000*a^2+3125000000*a*b+3750000*a*c-69875000*a+1875000*b^2+5000*b*c-87500*b+5*c^2-124*c+1050
Ja=2765625000000*a+3125000000*b+3750000*c-69875000
Jb=3125000000*a+3750000*b+5000*c-87500
Jc=3750000*a+5000*b+10*c-124
A=
1.0e+012*
2.7656250000000000.0031250000000000.000003750000000
0.0031250000000000.0000037500000000.000000005000000
0.0000037500000000.0000000050000000.000000000010000
B=
6987500087500124
C=-0.0000194285714290.039828571428571-0.228571428571423
g=-0.2285714285714238.51428571425882714.82857142846407518.71428571404432620.171428570999574
ans=5.75503723705041406005437127136252044.2449627177069388821200988843
7.基因距离表示
解:
前一段时间看过吴军博士的一本书《数学之美》,其中有一章的题目是:
余弦定理和新闻的分类,所以一看到这道题,参照书中新闻的分类,我认为题目中判断一个群体与另一个群体的接近程度,或者说一个表示基因的“距离”的合宜量度,应该用两个群体间各个基因组成向量之间的余弦定理来进行。
假设代表爱斯基摩人,班图人,英国人,朝鲜人的四种等位基因的向量分别为f1i,f2i,f3i,f4i,其中:
f1i=[0.29140.00000.03160.6770]T;
f2i=[0.10340.08660.12000.6900]T;
f3i=[0.20900.06960.06120.6602]T;
f4i=[0.22080.00000.20690.5723]T;
在MATLAB中输入上述4个向量,并分别求余弦,程序如下所示:
f1i=[0.29140.00000.03160.6770]
f2i=[0.10340.08660.12000.6900]
f3i=[0.20900.06960.06120.6602]
f4i=[0.22080.00000.20690.5723]
yuxian12=dot(f1i,f2i)/norm(f1i)/norm(f2i)
yuxian13=dot(f1i,f3i)/norm(f1i)/norm(f3i)
yuxian14=dot(f1i,f4i)/norm(f1i)/norm(f4i)
yuxian23=dot(f2i,f3i)/norm(f2i)/norm(f3i)
yuxian24=dot(f2i,f4i)/norm(f2i)/norm(f4i)
yuxian34=dot(f3i,f4i)/norm(f3i)/norm(f4i)
结果如下所示:
f1i=0.291400000000000.0316********
f2i=0.1034000000000000.0866000000000000.1200000000000000.690000000000000
f3i=0.2090000000000000.0696000000000000.0612000000000000.660200000000000
f4i=0.22080000000000000.2069000000000000.572300000000000
yuxian12=0.952270970088127
yuxian13=0.989070612813238
yuxian14=0.959680192407480
yuxian23=0.984373224079719
yuxian24=0.958470371187178
yuxian34=0.965391030460819
上述余弦值良好的表示了各个人种之间的差异,其中爱斯基摩人和英国人之间的差异最小,爱斯基摩人和班图人之间的差异最大。
读书的好处
1、行万里路,读万卷书。
2、书山有路勤为径,学海无涯苦作舟。
3、读书破万卷,下笔如有神。
4、我所学到的任何有价值的知识都是由自学中得来的。
——达尔文
5、少壮不努力,老大徒悲伤。
6、黑发不知勤学早,白首方悔读书迟。
——颜真卿
7、宝剑锋从磨砺出,梅花香自苦寒来。
8、读书要三到:
心到、眼到、口到
9、玉不琢、不成器,人不学、不知义。
10、一日无书,百事荒废。
——陈寿
11、书是人类进步的阶梯。
12、一日不读口生,一日不写手生。
13、我扑在书上,就像饥饿的人扑在面包上。
——高尔基
14、书到用时方恨少、事非经过不知难。
——陆游
15、读一本好书,就如同和一个高尚的人在交谈——歌德
16、读一切好书,就是和许多高尚的人谈话。
——笛卡儿
17、学习永远不晚。
——高尔基
18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。
——刘向
19、学而不思则惘,思而不学则殆。
——孔子
20、读书给人以快乐、给人以光彩、给人以才干。
——培根
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人口 迁移 问题 最小二乘法 基因 距离 表示 解读