多做题,通过考试没问题!

数据挖掘工程师

睦霖题库>商业经济行业技能考试>数据挖掘工程师

假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录p、q及两个簇C1、C2的信息如下,分别求出记录和簇彼此之间的距离。(k-means算法的拓展) p={男,广州,18},q={女,深圳,20} C1={男:25,女:5;广州:20,深圳:6,韶关:4;19} C2={男:3,女:12;汕头:12,深圳:1,湛江:2;24}

正确答案:取x=1,得到的各距离如下:
d(p,q)=1+1+20-18=4
d(p,C1)=(1-25/30)+(1-20/30)+(19-18)=1.5
d(p,C2)=(1-3/15)+(1-0/15)+(24-18)=7.8
d(q,C1)=(1-5/30)+(1-6/30)+(20-19)=79/30
d(q,C2)=(1-12/15)+(1-1/15)+(24-20)=77/15
d(C1,C2)=[1-(25*3+5*12)/(30*15)]+[1-(6*1)/(30*15)]+(24-19)=1003/150
答案解析:
进入题库查看解析

微信扫一扫手机做题