以文本方式查看主题

-  W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWL  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  [求助]关于weka的回归树的输出(考试,急)  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=54847)


--  作者:allegory
--  发布时间:11/3/2007 8:00:00 PM

--  [求助]关于weka的回归树的输出(考试,急)
下面是个weka回归树的输出,每个最终节点后有个百分比,LM1 (75/3.056%)谁知道是什么吗?我考试要用,谢谢了
MMAX <= 14000 :
|   CACH <= 8.5 :
|   |   MMAX <= 6100 : LM1 (75/3.056%)
|   |   MMAX >  6100 :
|   |   |   MYCT <= 83.5 :
|   |   |   |   MMAX <= 10000 : LM2 (8/2.545%)
|   |   |   |   MMAX >  10000 : LM3 (3/2.137%)
|   |   |   MYCT >  83.5 : LM4 (22/3.81%)
|   CACH >  8.5 :
|   |   CHMIN <= 7 :
|   |   |   MYCT <= 95 : LM5 (7/7.521%)
|   |   |   MYCT >  95 : LM6 (18/5.501%)
|   |   CHMIN >  7 : LM7 (8/25.484%)
MMAX >  14000 :
|   MMAX <= 22485 :
|   |   CACH <= 27 :
|   |   |   CHMIN <= 5 : LM8 (14/3.914%)
|   |   |   CHMIN >  5 : LM9 (5/7.243%)
|   |   CACH >  27 : LM10 (18/14.185%)
|   MMAX >  22485 :
|   |   CHMIN <= 10 :
|   |   |   MYCT <= 44 : LM11 (11/25.643%)
|   |   |   MYCT >  44 : LM12 (5/7.62%)
|   |   CHMIN >  10 :
|   |   |   MMAX <= 48000 : LM13 (11/69.192%)
|   |   |   MMAX >  48000 : LM14 (4/113.733%)
--  作者:DMman
--  发布时间:11/4/2007 12:19:00 PM

--  
决策树可以认为分为分类树和模型树。回归树是模型树的一种特例,在叶节点存储了能预测达到叶节点的实例类值的一个线性回归模型。您使用的是cpu.arff 共209条数据。建立的回归树共有14个叶子,代表建立了14个线性模型(LM = liner model)。
如 LM1 (75/3.056%)代表 线性模型1 共有75个实例,错误率为3.056%

--  作者:allegory
--  发布时间:11/4/2007 3:47:00 PM

--  
不是呀,比如有超过100%的是什么呢?还有,回归树是用这个叶子的全部点的平均值作为值,那么,怎么算是错误呢?
--  作者:DMman
--  发布时间:11/4/2007 4:42:00 PM

--  
提成"错误率"确实不恰当,称为 误差 或者 方差 可能还恰当点。回归树本质就是决策树,叶子上的若干点可以建立一个线性模型,模型用来分类,肯定是要有误差的。
对线性模型的一套理论我也不是很明了了。关于线性模型的误差的理论,应该有定义的计算公式的。就比如在2维空间有N个点,然后求一条直线的方程来拟合这N个点,每个点与直线的距离就可以认为是误差,如何衡量整体误差是有公式的。
您可以下载“数据挖掘:实用机器学习技术”好像在第6章有些详细的说明


--  作者:allegory
--  发布时间:11/4/2007 5:20:00 PM

--  
我已经看过了,真的没有,而且,误差怎么超过的100%呢?+我msn吧,pku_allegory@hotmail.com
--  作者:DMman
--  发布时间:11/4/2007 5:48:00 PM

--  
误差函数的计算公式就在英文版 248 页。它的值域并非限定在0-1之间
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms