<?xml version="1.0" encoding="gb2312"?>

<!-- RSS generated by oioj.net on 4/16/2004 ; 感谢LeXRus提供 RSS 2.0 文档; 此文件可自由使用，但请保留此行信息 --> 
<!-- Source download URL: http://blogger.org.cn/blog/rss2.asp       -->
<rss version="2.0">

<channel>
<title>IDMer (数据挖掘者)</title>
<link>http://blogger.org.cn/blog/blog.asp?name=idmer</link>
<description>数据挖掘者的博客</description>
<copyright>blogger.org.cn</copyright>
<generator>W3CHINA Blog</generator>
<webMaster>webmaster@blogger.org.cn</webMaster>
<item>
<title><![CDATA[数据挖掘中易犯的10大错误]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=45645</link>
<author>idmer</author>
<pubDate>2009/5/25 16:31:17</pubDate>
<description><![CDATA[<P><IMG style="BORDER-LEFT-COLOR: #000000; BORDER-BOTTOM-COLOR: #000000; BORDER-TOP-COLOR: #000000; BORDER-RIGHT-COLOR: #000000" height=300 src="http://www.blendsblog.com/wp-content/uploads/2007/11/brat_pitt_movie_mistakes_troy_trojan.jpg" width=200 align=left border=0>原文标题为“Top 10 Data Mining Mistakes”，作者是John F. Elder IV, Ph.D.<BR>编译：IDMer（数据挖掘者）<BR><A href="http://www.salford-systems.com/doc/elder.pdf"><U><FONT color=#000000 size=2>http://www.salford-systems.com/doc/elder.pdf</FONT></U></A></P>
<P><SPAN style="FONT-FAMILY: SimSun">按照</SPAN><SPAN style="FONT-FAMILY: Verdana">Elder</SPAN><SPAN style="FONT-FAMILY: SimSun">博士的总结，这</SPAN><SPAN style="FONT-FAMILY: Verdana">10</SPAN><SPAN style="FONT-FAMILY: SimSun">大易犯错误包括：</SPAN></P>
<P>0. 缺乏数据（Lack Data）<BR>1. 太关注训练（Focus on Training）<BR>2. 只依赖一项技术（Rely on One Technique）<BR>3. 提错了问题（Ask the Wrong Question）<BR>4. 只靠数据来说话（Listen (only) to the Data）<BR>5. 使用了未来的信息（Accept Leaks from the Future）<BR>6. 抛弃了不该忽略的案例（Discount Pesky Cases）<BR>7. 轻信预测（Extrapolate）<BR>8. 试图回答所有问题（Answer Every Inquiry）<BR>9. 随便地进行抽样（Sample Casually）<BR>10. 太相信最佳模型（Believe the Best Model）</P>
<P>&nbsp; </P>
<P><STRONG>0. 缺乏数据（Lack Data）</STRONG>&nbsp;<BR><BR>对于分类问题或预估问题来说，常常缺乏准确标注的案例。&nbsp;</P>
<P>例如：<BR><SPAN style="FONT-FAMILY: SimSun">－欺诈侦测（</SPAN><SPAN style="FONT-FAMILY: Verdana">Fraud Detection</SPAN><SPAN style="FONT-FAMILY: SimSun">）：在上百万的交易中，可能只有屈指可数的欺诈交易，还有很多的欺诈交易没有被正确标注出来，这就需要在建模前花费大量人力来修正。<BR></SPAN><SPAN style="FONT-FAMILY: SimSun">－信用评分（</SPAN><SPAN style="FONT-FAMILY: Verdana">Credit Scoring</SPAN><SPAN style="FONT-FAMILY: SimSun">）：需要对潜在的高风险客户进行长期跟踪（比如两年），从而积累足够的评分样本。</SPAN>&nbsp;</P>
<P><STRONG>1. 太关注训练（Focus on Training）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：就象体育训练中越来越注重实战训练，因为单纯的封闭式训练常常会训练时状态神勇，比赛时一塌糊涂。</SPAN><FONT color=#0000ff>&nbsp;</FONT></P>
<P>实际上，只有样本外数据上的模型评分结果才真正有用！（否则的话，直接用参照表好了！）</P>
<P>例如：<BR><SPAN style="FONT-FAMILY: SimSun">－癌症检测（</SPAN><SPAN style="FONT-FAMILY: Verdana">Cancer detection</SPAN><SPAN style="FONT-FAMILY: SimSun">）：</SPAN><SPAN style="FONT-FAMILY: Verdana">MD Anderson</SPAN><SPAN style="FONT-FAMILY: SimSun">的医生和研究人员（</SPAN><SPAN style="FONT-FAMILY: Verdana">1993</SPAN><SPAN style="FONT-FAMILY: SimSun">）使用神经网络来进行癌症检测，惊奇地发现，训练时间越长（从几天延长至数周），对训练集的性能改善非常轻微，但在测试集上的性能却明显下降。<BR></SPAN><SPAN style="FONT-FAMILY: SimSun">－机器学习或计算机科学研究者常常试图让模型在已知数据上表现最优，这样做的结果通常会导致过度拟合（</SPAN><SPAN style="FONT-FAMILY: Verdana">overfit</SPAN><SPAN style="FONT-FAMILY: SimSun">）。</SPAN>&nbsp;</P>
<P>解决方法：<BR><SPAN style="FONT-FAMILY: SimSun">解决这个问题的典型方法是重抽样（</SPAN><SPAN style="FONT-FAMILY: Verdana">Re-Sampling</SPAN><SPAN style="FONT-FAMILY: SimSun">）。重抽样技术包括：</SPAN><SPAN style="FONT-FAMILY: Verdana">bootstrap</SPAN><SPAN style="FONT-FAMILY: SimSun">、cross-validation、jackknife、leave-one-out...等等。</SPAN></P>
<P><STRONG>2. 只依赖一项技术（Rely on One Technique）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：这个错误和第</SPAN><SPAN style="FONT-FAMILY: Verdana">10</SPAN><SPAN style="FONT-FAMILY: SimSun">种错误有相通之处，请同时参照其解决方法。没有对比也就没有所谓的好坏，辩证法的思想在此体现无遗。</SPAN>&nbsp;</P>
<P>“当小孩子手拿一把锤子时，整个世界看起来就是一枚钉子。”要想让工作尽善尽美，就需要一套完整的工具箱。<BR>不要简单地信赖你用单个方法分析的结果，至少要和传统方法（比如线性回归或线性判别分析）做个比较。&nbsp;</P>
<P><SPAN style="FONT-FAMILY: SimSun">研究结果：按照《神经网络》期刊的统计，在过去</SPAN><SPAN style="FONT-FAMILY: Verdana">3</SPAN><SPAN style="FONT-FAMILY: SimSun">年来，只有</SPAN><SPAN style="FONT-FAMILY: Verdana">1/6</SPAN><SPAN style="FONT-FAMILY: SimSun">的文章中做到了上述两点。也就是说，在独立于训练样本之外的测试集上进行了开集测试，并与其它广泛采用的方法进行了对比。</SPAN></P>
<P>解决方法：<BR><SPAN style="FONT-FAMILY: SimSun">使用一系列好的工具和方法。（每种工具或方法可能最多带来</SPAN><SPAN style="FONT-FAMILY: Verdana">5%~10%</SPAN><SPAN style="FONT-FAMILY: SimSun">的改进）。</SPAN></P>
<P><STRONG>3. 提错了问题（Ask the Wrong Question）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：一般在分类算法中都会给出分类精度作为衡量模型好坏的标准，但在实际项目中我们却几乎不看这个指标。为什么？因为那不是我们关注的目标。</SPAN>&nbsp;</P>
<P><SPAN style="FONT-FAMILY: Verdana">a)</SPAN><SPAN style="FONT-FAMILY: SimSun">项目的目标：一定要锁定正确的目标</SPAN></P>
<P>例如：<BR><SPAN style="FONT-FAMILY: SimSun">欺诈侦测（关注的是正例！）（</SPAN><SPAN style="FONT-FAMILY: Verdana">Shannon</SPAN><SPAN style="FONT-FAMILY: SimSun">实验室在国际长途电话上的分析）：不要试图在一般的通话中把欺诈和非欺诈行为分类出来，重点应放在如何描述正常通话的特征，然后据此发现异常通话行为。</SPAN></P>
<P><SPAN style="FONT-FAMILY: Verdana">b)</SPAN><SPAN style="FONT-FAMILY: SimSun">模型的目标：让计算机去做你希望它做的事</SPAN></P>
<P>大多数研究人员会沉迷于模型的收敛性来尽量降低误差，这样让他们可以获得数学上的美感。但更应该让计算机做的事情应该是如何改善业务，而不是仅仅侧重模型计算上的精度。</P>
<P><STRONG>4. 只靠数据来说话（Listen (only) to the Data）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：“让数据说话”没有错，关键是还要记得另一句话：兼听则明，偏听则暗！如果数据＋工具就可以解决问题的话，还要人做什么呢？</SPAN>&nbsp;</P>
<P><SPAN style="FONT-FAMILY: Verdana">4a.</SPAN><SPAN style="FONT-FAMILY: SimSun">投机取巧的数据：数据本身只能帮助分析人员找到什么是显著的结果，但它并不能告诉你结果是对还是错。<BR></SPAN><SPAN style="FONT-FAMILY: Verdana">4b.</SPAN><SPAN style="FONT-FAMILY: SimSun">经过设计的实验：某些实验设计中掺杂了人为的成分，这样的实验结果也常常不可信。</SPAN>&nbsp;</P>
<P><STRONG>5. 使用了未来的信息（Accept Leaks from the Future）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：看似不可能，却是实际中很容易犯的错误，特别是你面对成千上万个变量的时候。认真、仔细、有条理是数据挖掘人员的基本要求。</SPAN>&nbsp;</P>
<P><SPAN style="FONT-FAMILY: SimSun">预报（</SPAN><SPAN style="FONT-FAMILY: Verdana">Forecast</SPAN><SPAN style="FONT-FAMILY: SimSun">）示例：预报芝加哥银行在某天的利率，使用神经网络建模，模型的准确率达到</SPAN><SPAN style="FONT-FAMILY: Verdana">95%</SPAN><SPAN style="FONT-FAMILY: SimSun">。但在模型中却使用了该天的利率作为输入变量。<BR></SPAN><SPAN style="FONT-FAMILY: SimSun">金融业中的预报示例：使用</SPAN><SPAN style="FONT-FAMILY: Verdana">3</SPAN><SPAN style="FONT-FAMILY: SimSun">日的移动平均来预报，但却把移动平均的中点设在今天。</SPAN>&nbsp;</P>
<P>解决方法：<BR>要仔细查看那些让结果表现得异常好的变量，这些变量有可能是不应该使用，或者不应该直接使用的。<BR>给数据加上时间戳，避免被误用。&nbsp;</P>
<P><STRONG>6. 抛弃了不该忽略的案例（Discount Pesky Cases）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：到底是“宁为鸡头，不为凤尾”，还是“大隐隐于市，小隐隐于野”？不同的人生态度可以有同样精彩的人生，不同的数据也可能蕴含同样重要的价值。</SPAN>&nbsp;</P>
<P>异常值可能会导致错误的结果（比如价格中的小数点标错了），但也可能是问题的答案（比如臭氧洞）。所以需要仔细检查这些异常。<BR>研究中最让激动的话语不是“啊哈！”，而是“这就有点奇怪了……”<BR>数据中的不一致性有可能会是解决问题的线索，深挖下去也许可以解决一个大的业务问题。</P>
<P>例如：<BR>在直邮营销中，在对家庭地址的合并和清洗过程中发现的数据不一致，反而可能是新的营销机会。&nbsp;</P>
<P>解决方法：<BR>可视化可以帮助你分析大量的假设是否成立。</P>
<P><STRONG>7. 轻信预测（Extrapolate）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：依然是辩证法中的观点，事物都是不断发展变化的。</SPAN>&nbsp;</P>
<P>人们常常在经验不多的时候轻易得出一些结论。<BR>即便发现了一些反例，人们也不太愿意放弃原先的想法。<BR>维度咒语：在低维度上的直觉，放在高维度空间中，常常是毫无意义的。&nbsp;</P>
<P>解决方法：<BR>进化论。没有正确的结论，只有越来越准确的结论。</P>
<P><STRONG>8. 试图回答所有问题（Answer Every Inquiry）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：有点像我爬山时鼓励自己的一句话“我不知道什么时候能登上山峰，但我知道爬一步就离终点近一步。”</SPAN>&nbsp;</P>
<P>“不知道”是一种有意义的模型结果。<BR><SPAN style="FONT-FAMILY: SimSun">模型也许无法</SPAN><SPAN style="FONT-FAMILY: Verdana">100%</SPAN><SPAN style="FONT-FAMILY: SimSun">准确回答问题，但至少可以帮我们估计出现某种结果的可能性。</SPAN>&nbsp;</P>
<P><STRONG>9. 随便地进行抽样（Sample Casually）</STRONG></P>
<P><SPAN style="FONT-FAMILY: Verdana">9a </SPAN><SPAN style="FONT-FAMILY: SimSun">降低抽样水平。例如，</SPAN><SPAN style="FONT-FAMILY: Verdana">MD</SPAN><SPAN style="FONT-FAMILY: SimSun">直邮公司进行响应预测分析，但发现数据集中的不响应客户占比太高（总共一百万直邮客户，其中超过</SPAN><SPAN style="FONT-FAMILY: Verdana">99%</SPAN><SPAN style="FONT-FAMILY: SimSun">的人未对营销做出响应）。于是建模人员做了如下抽样：把所有响应者放入样本集，然后在所有不响应者中进行系统抽样，即每隔</SPAN><SPAN style="FONT-FAMILY: Verdana">10</SPAN><SPAN style="FONT-FAMILY: SimSun">人抽一个放入样本集，直到样本集达到</SPAN><SPAN style="FONT-FAMILY: Verdana">10</SPAN><SPAN style="FONT-FAMILY: SimSun">万人。但模型居然得出如下规则：凡是居住在Ketchikan、Wrangell和Ward Cove Alaska的人都会响应营销。这显然是有问题的结论。（问题就出在这种抽样方法上，因为原始数据集已经按照邮政编码排序，上面这三个地区中不响应者未能被抽取到样本集中，故此得出了这种结论）。</SPAN></P>
<P>解决方法：“喝前摇一摇！”先打乱原始数据集中的顺序，从而保证抽样的随机性。</P>
<P><SPAN style="FONT-FAMILY: Verdana">9b </SPAN><SPAN style="FONT-FAMILY: SimSun">提高抽样水平。例如，在信用评分中，因为违约客户的占比一般都非常低，所以在建模时常常会人为调高违约客户的占比（比如把这些违约客户的权重提高</SPAN><SPAN style="FONT-FAMILY: Verdana">5</SPAN><SPAN style="FONT-FAMILY: SimSun">倍）。建模中发现，随着模型越来越复杂，判别违约客户的准确率也越来越高，但对正常客户的误判率也随之升高。（问题出在数据集的划分上。在把原始数据集划分为训练集和测试集时，原始数据集中违约客户的权重已经被提高过了）</SPAN></P>
<P>解决方法：先进行数据集划分，然后再提高训练集中违约客户的权重。</P>
<P><STRONG>10. 太相信最佳模型（Believe the Best Model）<BR></STRONG><SPAN style="FONT-FAMILY: Verdana">IDMer</SPAN><SPAN style="FONT-FAMILY: SimSun">：还是那句老话－“没有最好，只有更好！”</SPAN>&nbsp;</P>
<P>可解释性并不一定总是必要的。看起来并不完全正确或者可以解释的模型，有时也会有用。<BR>“最佳”模型中使用的一些变量，会分散人们太多的注意力。（不可解释性有时也是一个优点）<BR>一般来说，很多变量看起来彼此都很相似，而最佳模型的结构看上去也千差万别，无迹可循。但需注意的是，结构上相似并不意味着功能上也相似。</P>
<P>解决方法：把多个模型集装起来可能会带来更好更稳定的结果。</P><A></A>]]></description>
</item><item>
<title><![CDATA[古镇河边闲读，清明偷闲饮茶]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=44473</link>
<author>idmer</author>
<pubDate>2009/4/6 19:02:56</pubDate>
<description><![CDATA[原文参见：<A href="http://idmer.blog.sohu.com/113840831.html">http://idmer.blog.sohu.com/113840831.html</A> 
<P><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" height=200 alt="" src="http://lh4.ggpht.com/_JGfZmCmo7Fc/Sdn6-X_92yI/AAAAAAAABWY/lFebjtddbJI/s800/DSC00924.jpg" width=300 border=0>三天的清明节假期，在成都出差，还要一直待到18号。 </P>
<P>前两天受工作所累，在酒店写文档，昨晚写完，长长伸个懒腰，看一下牢笼一样的房间，觉得真是辜负了大好春光，小狗小猫尚且喜欢在草地上跑跳嬉戏，何况人乎？还是那句我经常说给同事听的名言有道理——“工作是永远做不完地……”，把任务计划暂且丢到一边，出去玩耍吧，就象猫啊狗啊鸡啊兔啊那样。 </P>
<P>常来成都的同事曾经向我提过成都周边的古镇，Google了一下，发现了很近很有名的黄龙溪，就在双流县，距离市区大约四十多公里。早上被手机上定好的闹钟吵醒，下去吃了久违两天的早餐，就直接去了新南门汽车站，那里有直接到古镇的班车。 </P>
<P>汽车站的人出乎意料的多，也许是因为节假日的缘故。排到窗前，告诉我最早的车次也是11点10分了，郁闷啊，我看了一下时间，才刚刚9点半。昨晚在网上看到去古镇的车每半小时一班，还以为是即来即上（Come and Go？）呢，自己被自己晃点了。刚一犹疑，售票的大姐又说了一句：“11点10分的车也只剩下最后一张了”，嗯，孔老夫子说过多思无益不如以学，我也就先买了票再说吧。 </P>
<P>买了车票从车站出来，还有一个半小时，该干啥呢？拦了辆出租车，心想50公里也不算太远，车费也应该不会很贵罢（成都出租车每公里1.4元）。开出租的大哥问我去哪里，我说黄龙溪，大哥很爽快，啥也没说，抬离合便走。开出100米，突然回头问我“是去xxx公园么？”等他弄明白是去古镇后，急忙说“去那里就不能打表咧”。我让他开个价，答曰200元，因为要放空回来。砍到100未果，于是下车重回路边。 </P>
<P>算了罢，还是不奢侈了，还是在旁边逛逛体验一下成都的生活吧。 </P>
<P>穿过一条街，又过了一条街，好像还过了一条街，象华文兄教给我的那句上海话——“东窥窥，西窥窥”，漫无目的地看人看景看树看房子。蓦然发现马路对面是川大华西校区，进去耍耍罢。 </P>
<P>足球场有人在踢球赛，咦，人怎么这么多？一五、一十、十五、二十……居然有三十多人。让我想起了大学刚毕业在中科院工作时所住的单身职工宿舍——小红楼，楼下的院子里也常常是30多人60多条腿在比篮球场大不了多少的空间玩这项运动，当然也包括我。看了一会儿，嗯，这个人动作太慢了，那个把球停大了，突破！突破啊！唉，被断了……心里正在想如果我在场上，应该会好一些罢。一位前锋或者前卫追球冲到离我很近的底线，竟然是满头的花白头发，再仔细看看其他人，也大多是花甲年岁。惭愧啊惭愧，没的比了。 </P>
<P>校区内继续前行，路牌上写着留学生宿舍，右边是林荫街。顺时针转向60度，林荫池塘映入眼帘。 </P>
<P><A href="http://pp.sohu.com/photoview-266693023-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://lh3.ggpht.com/_JGfZmCmo7Fc/SdojhgoC-dI/AAAAAAAABW8/xlTrRO3e-do/s800/DSC00903.jpg" border=0></A> </P>
<P>三三两两的老人坐在池塘边的长椅上，恬淡闲适，面对着一方似乎已变成可数名词的池水。偶尔有刻苦的学子从身边飘过，喃喃着我在学校里也曾喃过，或者更准确地说是难过的英文。有意思的是，他或她手里捧着的无不是那本让我倍感熟悉的《新概念英语》(三)，难道现在大学里的英文教材换了么？ </P>
<P>“噹……噹……”，突然的钟声让我不禁转头搜寻，原来是它—— </P>
<P><A href="http://pp.sohu.com/photoview-266692920-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://lh4.ggpht.com/_JGfZmCmo7Fc/Sdojiu0nDkI/AAAAAAAABXE/CTB0jIhadlA/s800/DSC00904.jpg" border=0></A></P>
<P>在川大里逛得时间差不多了，出来回新南门车站，顺便在路边买了本《中篇小说选刊》。本来想买本书，遗憾的是碰到的一个书屋里实在是乏善可陈，有陋室之实，而无陋室之名。</P>
<P>从成都到黄龙溪的确不算太远，大约过了一个小时，便到了。</P>
<P>距今已有1700年历史的黄龙溪，据说是全国十大古镇之一。不知道其他九位是谁？应该包括我曾经去过的平遥、丽江罢。（网上一查，发现谬矣。这两个应该算是古城，而且似乎这个十大的标准也无定论）。黄龙古名“赤水”，有句与它相关的诗相当地有名，那就是诗圣杜甫的“窗含西岭千秋雪，门泊东吴万里船”，据称这“万里船”出发的第一夜便是宿黄龙溪。黄龙溪镇区东面是鹿溪河，锦江的支流。</P>
<P>考古完毕，接下来便是古镇里无方向地漫游。</P>
<P><A href="http://pp.sohu.com/photoview-266692754-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://lh3.ggpht.com/_JGfZmCmo7Fc/Sdn64YBURUI/AAAAAAAABVI/l2zeeIRMKUk/s800/DSC00906.jpg" border=0></A></P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P>开始人还很多，然后渐行渐少。</P>
<P><A href="http://pp.sohu.com/photoview-266692651-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://lh4.ggpht.com/_JGfZmCmo7Fc/Sdn66GaKFPI/AAAAAAAABVg/VwntfqS-rsI/s640/DSC00911.jpg" border=0></A></P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P><A href="http://pp.sohu.com/photoview-266692617-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://lh5.ggpht.com/_JGfZmCmo7Fc/Sdn662-w86I/AAAAAAAABVo/KXLM3vNPyaQ/s640/DSC00912.jpg" border=0></A> </P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P><A href="http://pp.sohu.com/photoview-266692575-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://lh4.ggpht.com/_JGfZmCmo7Fc/Sdn67mzYonI/AAAAAAAABVw/J8yrU-GbOTc/s640/DSC00913.jpg" border=0></A> </P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P>古镇里随处可见“住宿 吃饭 机麻”的招牌，四川的麻将相当风行，和在北京时打麻将的感觉也截然不同。有人说“减肥是一种人生态度”，那么在四川，“打麻将也是一种人生态度”罢。茶馆中、大树下、甚至在一片桃花林中支起麻将桌，一边喝茶一边玩耍是何等惬意啊。在成都和客户、和18M的合作伙伴打过几次麻将，基本上都是在酒店，有一次在老顺兴茶馆，还未能把这种人生态度深刻体会。在古镇的河边，看到也有不少的人在玩，感觉应该很爽，可惜这次我是“一缺三”，无福消受。</P>
<P>古镇上有的旅馆还打出了“包月 吃住全包”的招牌，每月700元即可，呵呵，不错啊。</P>
<P>不知不觉古镇逛到了头，看到了一座城门式的建筑，上书“黄龙溪”，下书“古码头”。码头下的客船上用英文在welcome着来自五湖四海的游客。“我们来自五湖四海，为了一个共同的革命理想走到了一起……”，这个理想么，也许是逍遥罢。</P>
<P><A href="http://pp.sohu.com/photoview-266692553-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1843.img.pp.sohu.com.cn/images/2009/4/6/16/17/12125978878g213.jpg" border=0></A></P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P><A href="http://pp.sohu.com/photoview-266692477-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1873.img.pp.sohu.com.cn/images/2009/4/6/16/16/12125945c73g214.jpg" border=0></A> </P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P>从古码头折回，穿过小街小巷，还在不经意间发现了这个小东西：</P>
<P><A href="http://pp.sohu.com/photoview-266692450-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1833.img.pp.sohu.com.cn/images/2009/4/6/16/16/12125937759g215.jpg" border=0></A></P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P>它很专注哦，我给它偷拍，不，明拍时也丝毫未能影响到它。</P>
<P>还看到另外一只白色的小狗，侧躺在马路边………………睡着了。</P>
<P>还看到一位梳着马尾的老人，五六十岁，一看就有种文艺圈里的气质，在河堤旁拉着二胡。拉的曲子忘记了，似乎是革命年代的流行歌曲。每次有人向他面前的篮子里扔钱，他就会客气地说声谢谢。我听了会儿，也放了点钱在篮子里，他也很客气地说了声谢谢。</P>
<P>最后在河堤停下了脚步，准备打尖喝茶。对招揽客人的小妹说我想坐在靠近护栏的位子，小妹问我是几个人，我说只有我一个。她于是便开始摇头，嫌人太少，还要占据她们的黄金位置。我问喝茶是一个人多少钱，答曰10元/位。我说这样好了，那你就给我算两个人的价钱罢，算是补偿了，而且我还要在这里吃饭呢。小妹答应了，把我领到位置上，正准备坐下，老板过来了。</P>
<P>老板看起来也是50岁不到，又是重复小妹曾经做过的动作——摇头，我心想莫非他们都吃了摇头丸不成？</P>
<P>摇头老板跟我说“一个人太少了，为什么不带几个女朋友过来？”</P>
<P>我乐了：“我也想带啊，没带着”。</P>
<P>老板继续摇头：“带不来没本事啊”</P>
<P>我把头一低，叹口气说“你看看，我都没本事带人来了，只想在河边喝喝茶，看看书，放松一下，你还要说我，于心何忍啊……”</P>
<P>老板哈哈一笑，拍了拍我：“好罢，好罢，就坐这儿罢”</P>
<P><A href="http://pp.sohu.com/photoview-266692427-25524635.html" target=_blank><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://511.img.pp.sohu.com.cn/images/2009/4/6/16/16/1212594114ag214.jpg" border=0></A></P>
<DIV style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center"></DIV>
<P>吃了有名的“黄辣丁”和无名的野菜，看了两篇小说，这期上的“红酒”一文不错，值得推荐。</P>]]></description>
</item><item>
<title><![CDATA[Google提供免费的在线Web分析课程]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=43926</link>
<author>idmer</author>
<pubDate>2009/3/17 23:00:18</pubDate>
<description><![CDATA[<P><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" height=200 alt="" src="http://1812.img.pp.sohu.com.cn/images/blog/2009/3/17/22/7/120bf72c9fcg214.jpg" width=300 border=0>从2009年3月3日开始，Google开始提供一个在线课程，讨论web analytics技术以及Google Analytics的实施、管理和分析工具。本课程是免费的。</P>
<P>对web分析有兴趣的同仁可以打开以下网址查看：<A href="http://www.google.com/support/conversionuniversity/"><FONT color=#000000 size=2>http://www.google.com/support/conversionuniversity/</FONT></A></P>
<P>课程的主要内容包括：</P>
<P>Follow these lessons to prepare for the <A href="http://google.starttest.com/"><FONT color=#000000 size=2>Google Analytics Individual Qualification (IQ) test</FONT></A> or to simply become a more knowledgeable Google Analytics user. The presentations move quickly; use the Pause and Back buttons to make sure that you don't miss anything. You can click the Notes tab in the presentation to read what is being said. Access to a Google Analytics account is strongly recommended so that you can experiment and apply what you learn. </P>
<H3>First Steps</H3>
<UL>
<LI><SPAN>Introduction to Google Analytics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/ga_intro/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Introduction (6:29 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>what Google Analytics can do for your business or website 
<LI>how Google Analytics works 
<LI>how often your data is updated and how Google stores it 
<LI>how to set your Data Sharing preferences </LI></UL><A href="http://services.google.com/analytics/breeze/en/ga_intro/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Interface Navigation:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interface_navigation/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Interface Navigation (7:39 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to set date ranges and comparison date ranges 
<LI>how to graph data by day, week, and month 
<LI>how to compare multiple metrics on graphs 
<LI>about the user interface options for exporting data 
<LI>how to email reports to others 
<LI>how to navigate between report detail levels 
<LI>how to use the report views 
<LI>how to quickly segment and sort data in reports </LI></UL><A href="http://services.google.com/analytics/breeze/en/interface_navigation/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Installing the Google Analytics Tracking Code:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/installing_ga_code/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Installing the Google Analytics Tracking Code (7:37 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to create a new account 
<LI>where to place the Google Analytics Tracking Code 
<LI>about website setups that require customization 
<LI>how to verify installation </LI></UL><A href="http://services.google.com/analytics/breeze/en/installing_ga_code/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV></LI></UL>
<H3>Interpreting Reports</H3>
<UL>
<LI><SPAN>Guidelines:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_guidelines/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Guidelines (4:25 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>best practices for analyzing data 
<LI>how to analyze data trends 
<LI>how to use the data visualizations in Google Analytics </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_guidelines/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Pageviews, Visits, and Visitors:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_visits/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Pageviews, Visits, and Visitors (3:27 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>where to find Pageviews, Visits, and Visitors metrics 
<LI>how Pageviews, Visits, and Visitors are calculated 
<LI>the difference between Pageviews and Unique Pageviews 
<LI>the difference between Absolute Unique Visitors and New vs. Returning Visitors </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_visits/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Time Metrics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_time/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Time Metrics (2:11 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how Time on Page and Time on Site are calculated 
<LI>how Avg. Time on Page and Avg. Time on Site are calculated 
<LI>about the Length of Visit report </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_time/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Traffic Sources:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_trafficsources/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Traffic Sources (6:09 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>about the different kinds of traffic sources 
<LI>how to identify quality traffic 
<LI>how to identify revenue and conversion drivers 
<LI>what kinds of information to look for in keyword reports 
<LI>how campaign attribution works in Google Analytics </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_trafficsources/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Content Reports:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_content/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Content Reports (3:53 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to use and interpret the Top Content, Content by Title, and Content Drilldown reports 
<LI>how to use the Top Landing Pages report 
<LI>how to use and interpret the Navigation Summary report 
<LI>how to use and interpret the Entrance Paths report </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_trafficsources/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV></LI></UL>
<H3>Fundamentals</H3>
<UL>
<LI><SPAN>Profiles in Google Analytics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/accounts_profiles/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Accounts and Profiles (7:09 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to create, manage, and delete accounts 
<LI>best practices for managing accounts 
<LI>when to create profiles 
<LI>how to create, manage, and delete profiles </LI></UL><A href="http://services.google.com/analytics/breeze/en/accounts_profiles/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Campaign Tracking and AdWords Integration:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/campaigntracking_adwordsintegration/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Campaign Tracking and AdWords Integration (13:47 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to track campaigns using tagged links 
<LI>how to track AdWords campaigns 
<LI>when to use autotagging and how it works 
<LI>how to enable autotagging 
<LI>where to find AdWords data in your reports 
<LI>the expected kinds of data discrepancies between AdWords and Analytics data 
<LI>when and how to manually tag URLs 
<LI>how to use the URL Builder 
<LI>best practices for tagging links </LI></UL><A href="http://services.google.com/analytics/breeze/en/campaigntracking_adwordsintegration/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Analysis Focus - AdWords:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_adwords/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Understanding AdWords Reports (7:03 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to use the Clicks tab metrics in AdWords reports 
<LI>how to analyze the effect of search result position on performance 
<LI>how to track audio and TV campaigns in AdWords 
<LI>how to track ad performance </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_adwords/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Goals in Google Analytics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/goals/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Goals and Funnels (8:13 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>the purpose of using goals, goal values, and funnels 
<LI>when to use each Goal URL Match Type 
<LI>how to assign meaningful values to goals 
<LI>how goal conversions differ from transactions 
<LI>how filters can affect goals 
<LI>where to find goal and funnel information in reports </LI></UL><A href="http://services.google.com/analytics/breeze/en/goals/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Analysis Focus - Funnel Visualization:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_funnel/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Funnel Visualization (2:48 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to use and interpret the Funnel Visualization report </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_funnel/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Filters in Google Analytics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/filters/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Google Analytics Filters (10:31 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>when to apply filters in Google Analytics 
<LI>how filters act on data 
<LI>how to create custom filters 
<LI>the differences between the different kinds of filters (i.e. exclude, include, etc) 
<LI>how to filter Google AdWords traffic 
<LI>how to use filters and profiles together to track certain kinds of traffic 
<LI>best practices for using filters </LI></UL><A href="http://services.google.com/analytics/breeze/en/filters/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Regex and Google Analytics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/regex_ga/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Regex (8:59 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>when to use regular expressions in Google Analytics 
<LI>how to use the most common metacharacters: dot, backslash, etc. 
<LI>some examples of common regular expressions in Google Analytics </LI></UL><A href="http://services.google.com/analytics/breeze/en/regex_ga/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Cookies and Google Analytics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/ga_cookies/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Cookies and Google Analytics (11:25 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how Google Analytics uses cookies 
<LI>the differences between persistent and temporary cookies 
<LI>the differences between first party and third party cookies 
<LI>the names of the Google Analytics cookies and the information they track </LI></UL><A href="http://services.google.com/analytics/breeze/en/ga_cookies/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>E-commerce Tracking:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/ecommerce/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Ecommerce Tracking (5:21 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>where to find ecommerce metrics in reports 
<LI>how to enable and track ecommerce </LI></UL><A href="http://services.google.com/analytics/breeze/en/ecommerce/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Analysis Focus - Revenue Metrics:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/interpreting_reports_revenue/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Revenue Metrics (3:30 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>the differences between goal value and e-commerce revenue 
<LI>how $Index is calculated and how to use it </LI></UL><A href="http://services.google.com/analytics/breeze/en/interpreting_reports_revenue/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Domains and Subdomains:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/domains_subdomains/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Tracking Domains and Subdomains (7:14 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>when to track across domains using the _link() method 
<LI>when to track across domains using the _linkByPost() method 
<LI>how to track across subdomains 
<LI>best practices for tracking across subdomains 
<LI>how to track across multiple domains with subdomains </LI></UL><A href="http://services.google.com/analytics/breeze/en/domains_subdomains/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV></LI></UL>
<H3>In-Depth Analysis</H3>
<UL>
<LI><SPAN>Custom Reporting:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/custom_reporting/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Custom Reporting (4 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to create, save, and edit a custom report </LI></UL><A href="http://services.google.com/analytics/breeze/en/custom_reporting/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Advanced Segmentation:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/advanced_segmentation/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Advanced Segments (6 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how Advanced Segments differ from filtered profiles 
<LI>to apply an Advanced Segment to your reports 
<LI>how to create and modify an Advanced Segment </LI></UL><A href="http://services.google.com/analytics/breeze/en/advanced_segmentation/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Motion Charts:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/motion_charts/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Motion Charts (4 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to read Motion Charts 
<LI>how to create and save a Motion Chart </LI></UL><A href="http://services.google.com/analytics/breeze/en/motion_charts/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Internal Site Search:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/internal_site_search/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Internal Site Search (9:40 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to set up internal site search 
<LI>why internal site search is important 
<LI>how to find site search information in your reports 
<LI>how to interpret the Site Search Usage, Terms, Start Pages, and Destination Pages reports 
<LI>how to use Search Refinement and Search Navigation options with the Search Terms report 
<LI>how to set up and analyze Site Search Categories 
<LI>how to find Site Search Trending 
<LI>how Site Search metrics differ from the metrics in other reports </LI></UL><A href="http://services.google.com/analytics/breeze/en/internal_site_search/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Event Tracking and Virtual Pageviews:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/et_vps/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Event Tracking and Virtual Pageviews (7 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>when to use virtual pageviews versus event tracking 
<LI>how to generate a virtual pageview 
<LI>how to track an event using _trackEvent() 
<LI>the relationship between Categories, Actions, Labels, and Values 
<LI>the difference between Total Events and Unique Events 
<LI>best practices for setting up Event Tracking </LI></UL><A href="http://services.google.com/analytics/breeze/en/et_vps/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>The Custom Visitor Segment Variable:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/customvisitorsegmentation/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> 
<DIV style="DISPLAY: none">
<P>Custom Visitor Segmentation Variable (4:08 minutes)</P>
<P>In this lesson, you will learn:</P>
<UL>
<LI>how to use and set the User Defined variable 
<LI>the best practices for using User Defined 
<LI>how to view User Defined values in reports </LI></UL><A href="http://services.google.com/analytics/breeze/en/customvisitorsegmentation/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </DIV>
<LI><SPAN>Additional Customizations:</SPAN> <A href="http://blog.sohu.com/manage/entry.do?m=edit&amp;id=112474372&amp;t=shortcut#"><FONT color=#000000 size=2>What you'll learn</FONT></A> | <A href="http://services.google.com/analytics/breeze/en/additional_customizations/index.html" target=_blank><FONT color=#000000 size=2>Watch presentation</FONT></A> </LI></UL>]]></description>
</item><item>
<title><![CDATA[升职为Principal Consultant]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=42456</link>
<author>idmer</author>
<pubDate>2009/1/14 17:27:19</pubDate>
<description><![CDATA[<P>今天老板email发出了Promotion Announcement，我从Senior Consultant升职为Principal Consultant，这个职位的中文翻译为“首席咨询顾问”。以前常常以为首席顾问只有一个，其实是种误解，这只是一个职位而已。虽然我早就认为自己不比其他的Principal Consultant差，也许还需要在入职时增加一些谈判技巧吧。无论如何，升职是对个人的一种肯定。</P>
<P>高级顾问（Senior Consultant）和首席顾问（Principal Consultant）之间差了一个level，我看了一下公司内部关于Work Stream的说明，两者的描述简要如下，也给大家参考吧：</P>
<P><U><STRONG>Senior Consultant</STRONG><BR></U>At this level the employee demonstrates in-depth practical and theoretical knowledge to define project outcomes, organise their own work and the work of others.&nbsp; Requires a working knowledge of a variety of technical processes as well as the ability to evaluate and modify approaches to meet requirements.</P>
<P><STRONG><U>Principal Consultant</U><BR></STRONG>At this level the employee provides expert knowledge technical disciplines, demonstrates credibility with clients and peers concerning interactions and application to customer issues inside and outside of SAS.&nbsp; Develops methods, plans or tools to improve solution quality and minimise high-risk components of the work.<BR></P>]]></description>
</item><item>
<title><![CDATA[分析能力的8个等级]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=42216</link>
<author>idmer</author>
<pubDate>2009/1/8 0:40:40</pubDate>
<description><![CDATA[<P><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" alt="" src="http://1851.img.pp.sohu.com.cn/images/blog/2009/1/8/0/7/11f5b25cffag214.jpg" width=300 border=0>本文源自<A href="http://www.sas.com/news/sascom/2008q4/column_8levels.html"><FONT color=#000000 size=2>Eight levels of analytics</FONT></A>，编译：IDMer。</P>
<P>并非所有的分析方法作用都相同。和大多数软件解决方案一样，你会发现分析方法的能力也存在差异，从简单明了的到高级复杂。下面我们按照不同分析方法所能给人带来的智能程度，把分析能力划分为8个等级。</P>
<P>
<TABLE cellSpacing=2 cellPadding=3>
<TBODY>
<TR>
<TD vAlign=top><IMG style="WIDTH: 100px; HEIGHT: 111px" alt="" src="http://www.sas.com/images/sascom/2008q4/body_1a.jpg" border=0> </TD>
<TD><STRONG>1. 标准报表<BR></STRONG>回答: 发生了什么？什么时候发生的？<BR>示例：月度或季度财务报表<BR><BR>我们都见过报表，它们一般是定期生成，用来回答在某个特定的领域发生了什么。从某种程度上来说它们是有用的，但无法用于制定长期决策。<BR><BR>
<HR>
</TD></TR>
<TR>
<TD style="PADDING-RIGHT: 15px" vAlign=top><IMG style="WIDTH: 100px; HEIGHT: 111px" alt="" src="http://www.sas.com/images/sascom/2008q4/body_2a.jpg" border=0> </TD>
<TD><STRONG>2. 即席查询<BR></STRONG>回答：有多少数量？发生了多少次？在哪里？<BR>示例：一周内各天各种门诊的病人数量报告。<BR><BR>即席查询的最大好处是，让你不断提出问题并寻找答案。<BR><BR>
<HR>
</TD></TR>
<TR>
<TD vAlign=top><IMG style="WIDTH: 100px; HEIGHT: 111px" alt="" src="http://www.sas.com/images/sascom/2008q4/body_3a.jpg" border=0> </TD>
<TD><STRONG>3. 多维分析</STRONG><BR>回答：问题到底出在哪里？我该如何寻找答案？<BR>示例：对各种手机类型的用户进行排序，探查他们的呼叫行为。<BR><BR>通过多维分析(OLAP)的钻取功能，可以让您有初步的发现。钻取功能如同层层剥笋，发现问题所在。<BR><BR>
<HR>
</TD></TR>
<TR>
<TD vAlign=top><IMG style="WIDTH: 100px; HEIGHT: 111px" alt="" src="http://www.sas.com/images/sascom/2008q4/body_4a.jpg" border=0> </TD>
<TD><STRONG>4. 警报<BR></STRONG>回答：我什么时候该有所反应？现在该做什么？<BR>示例：当销售额落后于目标时，销售总监将收到警报。&nbsp;<BR><BR>警报可以让您知道什么时候出了问题，并当问题再次出现时及时告知您。警报可以通过电子邮件、RSS订阅、评分卡或仪表盘上的红色信号灯来展示。<BR><BR>
<HR>
</TD></TR>
<TR>
<TD vAlign=top><STRONG><IMG style="WIDTH: 100px; HEIGHT: 111px" alt="" src="http://www.sas.com/images/sascom/2008q4/body_5a.jpg" border=0> </STRONG></TD>
<TD><STRONG>5. 统计分析<BR></STRONG>回答：为什么会出现这种情况？我错失了什么机会？<BR>示例：银行可以弄清楚为什么重新申请房贷的客户在增多。<BR><BR>这时您已经可以进行一些复杂的分析，比如频次分析模型或回归分析等等。统计分析是在历史数据中进行统计并总结规律。<BR><BR>
<HR>
</TD></TR>
<TR>
<TD vAlign=top><IMG style="WIDTH: 100px; HEIGHT: 111px" alt="" src="http://www.sas.com/images/sascom/2008q4/body_6a.jpg" border=0> </TD>
<TD><STRONG>&nbsp;6. 预报<BR></STRONG>回答：如果持续这种发展趋势，未来会怎么样？还需要多少？什么时候需要？<BR>示例：零售商可以预计特定商品未来一段时间在各个门店的需求量。<BR><BR>预报可以说是最热门的分析应用之一，各行各业都用得到。特别对于供应商来说，能够准确预报需求，就可以让他们合理安排库存，既不会缺货，也不会积压。&nbsp;<BR><BR>
<HR>
</TD></TR>
<TR>
<TD vAlign=top>&nbsp;<IMG style="WIDTH: 100px; HEIGHT: 111px" height=111 alt="" src="http://www.sas.com/images/sascom/2008q4/body_7a.jpg" width=100 border=0>&nbsp; </TD>
<TD><STRONG>&nbsp;7. 预测型建模<BR></STRONG>回答：接下来会发生什么？它对业务的影响程度如何？<BR>示例：酒店和娱乐行业可以预测哪些VIP客户会对特定度假产品有兴趣。<BR><BR>如果您拥有上千万的客户，并希望展开一次市场营销活动，那么哪些人会是最可能响应的客户呢？如何划分出这些客户？哪些客户会流失？预测型建模能够给出解答。<BR><BR>
<HR>
</TD></TR>
<TR>
<TD vAlign=top>&nbsp;<IMG style="WIDTH: 100px; HEIGHT: 111px" alt="" src="http://www.sas.com/images/sascom/2008q4/body_8a.jpg" border=0>&nbsp; </TD>
<TD><STRONG>&nbsp;8. 优化<BR></STRONG>回答：如何把事情做得更好？对于一个复杂问题来说，那种决策是最优的？<BR>示例：在给定了业务上的优先级、资源调配的约束条件以及可用技术的情况下，请您来给出IT平台优化的最佳方案，以满足每个用户的需求。<BR><BR>优化带来创新，它同时考虑到资源与需求，帮助您找到实现目标的最佳方式。</TD></TR></TBODY></TABLE></P>]]></description>
</item><item>
<title><![CDATA[开源数据挖掘软件 KNIME 2.0.0发布]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=42168</link>
<author>idmer</author>
<pubDate>2009/1/6 20:50:51</pubDate>
<description><![CDATA[
<DIV class=item-content><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" alt="" src="http://1841.img.pp.sohu.com.cn/images/blog/2009/1/6/20/13/11f55282302g213.jpg" width=300 border=0>译自：<A href="http://www.kdnuggets.com/news/2009/n01/7i.html"><FONT color=#000000 size=2>kdnuggets news</FONT></A>&nbsp; 编译：IDMer<BR><BR>KNIME v2.0.0版最近刚刚发布。KNIME(发音为[naim])是免费的数据探索平台，让用户可以可视化地创建数据流，选择性地执行分析步骤，并通过数据和模型的交互式观察来展开结果分析。在KNIME中可以通过插件形式，调用Weka和R等开源项目的机器学习和统计算法<FONT color=#0000ff>（IDMere：这个功能非常好，Weka和R分别是这两个领域中非常著名的开源软件，它们的算法也非常全）</FONT>。KNIME可以运行在Windows和Linux系统(32位或64位)上，使用其SDK可以采用向导方式来创建自定义的扩展节点。</DIV>
<DIV class=item-content id=main-content>
<P>新版本可以在<A href="http://www.knime.org/download"><FONT color=#000000 size=2>http://www.knime.org/download</FONT></A>下载。该版本进行了一些显著的改进，包括：</P>
<UL>
<LI>增加了20个新功能节点（另外WEKA插件也新增了70个新节点） 
<LI>重新定义的数据库编程接口API 
<LI>改进元数据节点处理 
<LI>优化工作量管理 
<LI>用户界面大幅改进，使得工作流集装和数据探查更加容易 
<LI>支持工作流变量和循环 
<LI>为某些数据挖掘节点提供PMML支持</LI></UL><BR>进一步的详细信息，请参见<A href="http://www.knime.org/documentation/changelog"><FONT color=#000000 size=2>http://www.knime.org/documentation/changelog</FONT></A>。 
<UL></UL>
<P><BR><B>From: Michael Berthold</B> <BR><B>Date: 27 Dec 2008</B> <BR><B>Subject: KNIME 2.0.0 released</B> </P>
<P>KNIME version 2.0.0 was just released. KNIME, pronounced [naim], is a free modular data exploration platform that enables the user to visually create data flows (often referred to as pipelines), selectively execute some or all analysis steps, and later investigate the results through interactive views on data and models. KNIME features additional plugins which allow to use machine learning and statistical data analysis algorithms from other open source projects such as Weka and R. KNIME runs on Windows and Linux (32/64bit) and the SDK version comes with a wizard which simplifies creation of own extensions. Note that the KNIME team offers a training workshop in San Francisco in early February 2009 (see <A href="http://www.knime.org/about/events"><FONT color=#000000 size=2>www.knime.org/about/events</FONT></A> for details). </P>
<P>The new version is available for download at <A href="http://www.knime.org/download"><FONT color=#000000 size=2>http://www.knime.org/download</FONT></A>. This is a major release with a number of significant improvements, among others: </P>
<P>
<UL>
<LI>more than 20 new nodes (not counting 70 new nodes in the WEKA extension) 
<LI>a newly defined database API for performing operations on databases 
<LI>improved meta node handling 
<LI>optimized workflow management 
<LI>many improvements on the user interface to ease workflow assembly and data inspection 
<LI>new support for workflow variables and workflow loops 
<LI>PMML support for some of the data mining nodes </LI></UL>For a detailed list, see <A href="http://www.knime.org/documentation/changelog"><FONT color=#000000 size=2>http://www.knime.org/documentation/changelog</FONT></A> </DIV>]]></description>
</item><item>
<title><![CDATA[【转】互联网CEO学历与籍贯，50%硕博，北京、浙江、陕西人居多]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=42104</link>
<author>idmer</author>
<pubDate>2009/1/3 23:44:45</pubDate>
<description><![CDATA[<P><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" height=200 alt="" src="http://1851.img.pp.sohu.com.cn/images/blog/2009/1/3/23/10/11f46407585g215.jpg" width=300 border=0>转自：<A href="http://www.20ju.com/content/V65411.htm"><FONT color=#000000 size=2>http://www.20ju.com/content/V65411.htm</FONT></A><BR>原作者：司马官人</P>
<P>看看人们心目中的互联网精英都是什么北京吧，部分国内知名网站创始人或老总的学历、籍贯的整理，说不定能找到和你有相似背景的呢，只要你努力，说不定也能变成他们。 <BR>（排名不分先后） </P>
<P>（1）百度 <BR>创始人：李彦宏 <BR>籍贯：山西阳泉 <BR>学历：北京大学信息管理专业本科，布法罗纽约州立大学完成计算机科学硕士 </P>
<P>（2）腾讯 <BR>创始人：马化腾 <BR>籍贯：广东潮阳 <BR>学历：深圳大学计算机专业本科 </P>
<P>（3）新浪 <BR>创始人：王志东（已离职，创办点击科技） <BR>籍贯：广东东莞 <BR>学历：北京大学无线电电子学本科 <BR>现任总裁：曹国伟 <BR>籍贯：上海 <BR>学历：复旦大学新闻系本科，美国奥克拉荷马大学新闻学硕士及德州奥斯町大学商业管理学院财务专业硕士。 </P>
<P>（4）搜狐 <BR>创始人：张朝阳 <BR>籍贯：陕西西安 <BR>学历：清华大学物理系本科，美国麻省理工大学博士 </P>
<P>（5）网易 <BR>创始人：丁磊 <BR>籍贯：浙江宁波 <BR>学历：成都电子科技大学本科 </P>
<P>（6）迅雷 <BR>创始人：邹胜龙 <BR>籍贯：安徽淮南 <BR>学历：美国杜克大学计算机科学硕士 </P>
<P>（7）淘宝、中国雅虎、阿里巴巴 <BR>创始人：马云 <BR>籍贯：浙江杭州 <BR>学历：杭州师范学院英语专业本科 </P>
<P>（8）google <BR>中国区老总：李开复 <BR>籍贯：台湾 <BR>学历：美国卡内基梅隆大学计算机学博士。 </P>
<P>（9）优酷 <BR>创始人：古永锵 <BR>籍贯：不详，只知道是中国人 <BR>学历：加利福尼亚伯克利(Berkeley)分校，获学士学位，而后在斯坦福(Stanford)大学获得MBA学位。 </P>
<P>（10）hao123、4399在线游戏 <BR>创始人：李兴平 <BR>籍贯：广东兴宁 <BR>学历：初中 </P>
<P>（11）土豆 <BR>创始人：王微 <BR>籍贯：福建 <BR>学历：王微拥有欧洲工商管理学院(INSEAD，枫丹白露，法国)的MBA学位以及约翰霍普金斯大学的计算机硕士学位。 </P>
<P>（12）酷六 <BR>创始人：李善友 <BR>籍贯：吉林省吉林市 <BR>学历：南开大学获得数学学士学位，并在中欧国际工商学院获MBA学位。 </P>
<P>（13）51.com <BR>创始人：庞东升 <BR>籍贯：浙江天台 <BR>学历：宁波大学经济学本科 </P>
<P>（14）凤凰网 <BR>CEO：刘爽 <BR>籍贯：江苏常州 <BR>学历：美国杜克大学法学博士 </P>
<P>（15）我乐网（56.com） <BR>创始人：周娟 <BR>籍贯：江西临川 <BR>学历： 中国科技大学计算机本科 </P>
<P>（16）TOM <BR>CEO：王雷雷 <BR>籍贯：北京 <BR>学历：清华大学电子工程系本科 </P>
<P>（17）六间房 <BR>创始人：刘岩 <BR>籍贯：北京 <BR>学历：北京大学数学系毕业本科 </P>
<P>（18）开心网 <BR>创始人：程炳皓 <BR>籍贯：不详（太低调了） <BR>学历：不详（太低调了） </P>
<P><BR>（19）东方财富网 <BR>创始人：其实（我可没打错啊，名字是有点怪） <BR>籍贯：上海 <BR>学历：上海交通大学本科，复旦大学EMBA </P>
<P>（20）卓越 <BR>前CEO：王树彤（女）现敦煌网(http://www.dhgate.com/)总经理 <BR>籍贯：北京 <BR>学历：北京电子工程学院本科 </P>
<P><BR>（21）中华网 <BR>创始人：叶克勇 <BR>籍贯：香港 <BR>学历：美国沃顿工商管理学院硕士 </P>
<P><BR>（22）猫扑社区、校内 <BR>猫扑 <BR>创始人：田哲 <BR>籍贯： 长沙 <BR>学历：不详（相当低调） </P>
<P>（23）校内、海内、饭否 <BR>创始人：王兴 <BR>籍贯： 北京 <BR>学历：清华大学电子工程系无线电专业本科，美国特拉华大学（University of Delaware)电子与计算机工程系硕士 </P>
<P>猫扑和校内，中国人 <BR>现在的老总：陈一舟 <BR>籍贯：湖北武汉 <BR>学历：武汉大学物理系本科，美国麻省理工大大学硕士，张朝阳是校友啊。 </P>
<P>（24）中国博客网 <BR>创始人：方兴东 <BR>籍贯：浙江义乌 <BR>学历：西安交大本科硕士,清华大学传播学博士 </P>
<P>（25）PPlive <BR>创始人：姚欣 <BR>籍贯：河南 <BR>学历：华中科技大学计算机本科，读到研究生一年级时休学创业 </P>
<P>（26）分贝网 <BR>创始人：郑立 <BR>籍贯：重庆人 <BR>学历：四川大学物理系大专 </P>
<P>（27）小熊在线 <BR>创始人：张睿 <BR>籍贯：浙江杭州 <BR>学历：合肥工业大学本科，中国航天部运载火箭研究院硕士。 </P>
<P>（28）汽车之家、泡泡网、手机之家 <BR>创始人：李想 <BR>籍贯：河北石家庄 <BR>学历：高中 </P>
<P>（29）奇虎、3721 <BR>创始人：周鸿祎 <BR>籍贯：湖北黄冈 <BR>学历：西安交大管理学院系统工程系获硕士学位 </P>
<P>（30）天涯社区 <BR>创始人： 刑明 <BR>籍贯： 海南 <BR>学历：中山大学中文系本科 </P>
<P><BR>（31）搜房网 <BR>创始人：莫天全 <BR>籍贯：广西桂林市 <BR>学历：华南理工大学机械系本科，清华大学经济管理学院硕士，美国印第安纳大学经济与管理双博士学位。 </P>
<P>（32）天空软件站 <BR>创始人：张鹤 <BR>籍贯： 湖北省武穴市 <BR>学历：华中师范大学计算机本科 </P>
<P>（33）空中网 <BR>创始人：周云帆 <BR>籍贯：北京 <BR>学历：毕业于清华大学电子工程系,获学士学位;后取得斯坦福大学电机工程系硕士学位 <BR>创始人：杨宁 <BR>籍贯：西安 <BR>学历：美国Michigan大学电机工程学士，美国Stanford大学电机工程硕士学位 </P>
<P>（34）前程无忧 <BR>创始人：甄荣辉 <BR>籍贯：香港 <BR>学历：香港中文大学工程系 </P>
<P>（35）世纪佳缘 <BR>创始人：龚海燕 <BR>籍贯：湖南省桃园县 <BR>学历：北京大学文学本科、复旦大学新闻学硕士 </P>
<P>（36）中华英才网 <BR>创始人：张杰贤 <BR>籍贯：四川 <BR>学历：四川大学英文系本科 </P>
<P>（37）盛大在线 <BR>创始人： 陈天桥 <BR>籍贯：浙江新昌 <BR>学历：复旦大学经济系本科（成绩优异，提前一年毕业） </P>
<P>（38）265网址导航 <BR>创始人： 蔡文胜 <BR>籍贯：福建石狮 <BR>学历：高中 </P>
<P>（39）焦点房产网 <BR>创始人：龚宇 <BR>籍贯：北京 <BR>学历：清华大学自动化系获得自动控制理论及应用工学博士 </P>
<P>（40）西祠胡同 <BR>创始人： 网名“响马” <BR>籍贯： 河南 <BR>学历：曾经南京动力专科学院的一名教师，至少是个本科吧 </P>
<P>（41）U9网 <BR>创始人：刘亮 <BR>籍贯：陕西 <BR>学历：当过警察和参过军，高中毕业 </P>
<P>(42)豆瓣网 <BR>创始人： 杨勃 <BR>籍贯： 陕西汉中 <BR>学历：清华大学物理系本科,美国加州大学物理系博士, </P>
<P>（43）起点小说网 <BR>创始人：吴文辉 <BR>籍贯：北京 <BR>学历：北京大学计算机系本科 </P>
<P>（44）UUME <BR>创始人：刘健 <BR>籍贯：上海 <BR>学历：上海交通大学计算机系，美国斯坦福大学商学院，取得MBA学位 </P>
<P>（45）当当 <BR>创始人：俞渝（女） <BR>籍贯： 重庆 <BR>学历：北京外国语学院英语专业本科，纽约大学MBA </P>
<P>（46）爆米花视频 <BR>创始人：吴根良 <BR>籍贯： 北京 <BR>学历：北京邮电大学网络应用专业的硕士 </P>
<P>（47）久游网 <BR>创始人：王子杰 <BR>籍贯：浙江省宁波市 <BR>学历：复旦大学数学系硕士 <BR>（48）金融界 <BR>创始人： 张立波 <BR>籍贯：东北 <BR>学历：北京大学硕士 </P>
<P>（49）veryCD <BR>创始人： 黄一孟 <BR>籍贯：上海 <BR>学历：上海大学本科（辍学） </P>
<P>（50）携程网 <BR>创始人： 季琦 <BR>籍贯：江苏省如东县 <BR>学历：上海交通大学机械工程系机器人专业硕士 </P>
<P>（51）口碑网 <BR>创始人：李治国 <BR>籍贯：河南济源市 <BR>学历：大专 </P>
<P>（52）酷讯网 <BR>创始人：陈华 <BR>籍贯： 广东台山 <BR>学历：北京大学计算机硕士 </P>
<P>（53）爱帮网 <BR>创始人：刘建国 <BR>籍贯：陕西 <BR>学历：西安交通大学计算机科学工程系本科，北京大学计算机科学技术系硕士 </P>
<P>（54）中国站长站 <BR>创始人：姚剑军 <BR>籍贯：福建泉州 <BR>学历：中专 </P>
<P>（55）我爱打折 <BR>创始人：韩华 <BR>籍贯：陕西咸阳 <BR>学历：北京航空航天大学 项目管理 硕士 </P>
<P>（56）手机之家 <BR>创始人：高春辉 <BR>籍贯：辽宁沈阳 <BR>学历：职业高中 <BR>（57）IT168 <BR>创始人：宫玉国 <BR>籍贯：山东曲阜 <BR>学历：北京大学中文系本科 </P>
<P>（58）一听音乐网 <BR>创始人：杜雪骞 <BR>籍贯：江苏 <BR>学历：扬州大学工程管理系本科 </P>
<P>（59）狗仔网、中国娱乐网 <BR>创始人：高燃 <BR>籍贯：湖南人 <BR>学历：清华大学新闻系本科 </P>
<P>（60）DISCUZ <BR>创始人：戴志康 <BR>籍贯：黑龙江 <BR>学历：哈尔滨工程大学计算机专业，中途退学创业 </P>
<P>（61）赶集网 <BR>创始人：杨浩涌 <BR>籍贯：湖南 <BR>学历：中国科技大学工学学士，美国耶鲁大学计算机科学硕士 </P>
<P>（62）中国化工网 <BR>创始人：孙德良 <BR>籍贯：浙江萧山 <BR>学历：沈阳工业大学计算机专业本科 <BR>&nbsp;<BR>（63）潇湘书院 <BR>创始人：鲍伟康 <BR>籍贯：江苏 <BR>学历：高中 </P>
<P>（64）大旗网 <BR>董事长创始人：王定标 <BR>籍贯：江苏淮安人 <BR>学历：清华大学机电工程系本科 </P>
<P>（65）9158 <BR>创始人：傅政军 <BR>籍贯：浙江 <BR>学历：浙江工业大学本科 </P>
<P>（66）粉丝网 <BR>创始人：王吉鹏 <BR>籍贯：北京 <BR>学历：中国人民大学本科 </P>
<P>（67）悠视网 <BR>创始人：李竹 <BR>籍贯：北京 <BR>学历：清华大学计算机系 </P>
<P>综上统计一下 <BR>籍贯： </P>
<P>北京：10人 <BR>浙江：9人 <BR>陕西：5人 <BR>江苏：5人 <BR>广东：4人 <BR>上海：4人 <BR>湖南：3人 <BR>东北：3人 <BR>福建：3人 <BR>河南：3人 <BR>湖南：3个 <BR>湖北：3人 <BR>不详：2人 <BR>四川：2人 <BR>香港：2人 <BR>河北：1人 <BR>广西：1人 <BR>山东：1人 <BR>台湾：1人 <BR>安徽：1人 <BR>山西：1人 <BR>重庆：1人 <BR>四川：1人 <BR>江西：1人 </P>
<P>学历： </P>
<P>博士：7人 <BR>硕士：26人 <BR>本科：24人 <BR>专科：2人 <BR>大学一下：6人 <BR>辍学：2人 <BR>不详：1人 </P>
<P>总结一下： </P>
<P>北京皇城跟下,上海国际大都市能人多不说了，其次就是陕西和浙江了，不知道是不是出了张朝阳和马云的缘故。学历方面，大部分是名校，硕博士学历占近百分之50，说上学没用的年轻人要学习一下哦，成功不问出身，关键是有真才实学，并非唯学历是途。（能力有限资料不全，欢迎补充）。</P>]]></description>
</item><item>
<title><![CDATA[开源的数据挖掘工具]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=41774</link>
<author>idmer</author>
<pubDate>2008/12/16 16:40:54</pubDate>
<description><![CDATA[
<DIV id=articleInnerContent>
<DIV id=contentLabelBox>
<DIV class=item-content><SPAN id=tagsBox></SPAN></DIV><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" height=200 alt="" src="http://1861.img.pp.sohu.com.cn/images/blog/2008/12/16/16/20/11ee7a7e15bg213.jpg" width=300 border=0><FONT color=#0000ff>本文的主要内容编译自Blaz Zupan和Janez Demsar的一篇论文（Open-Source Tools for Data Mining），原文参见http://magix.fri.uni-lj.si/blaz/papers/2008-OpenSourceDataMining.pdf。我仅仅选择其中的要点和大家共享，同时加入一些个人的点评意见。</FONT></DIV>
<DIV class=item>
<DIV id=entry>
<DIV class=item-body>
<DIV class=item-content id=main-content>
<P><FONT color=#0000ff>此外，对开源的数据挖掘工具有兴趣的同仁，可以关注以下OSDM09这个workshop，它会在PAKDD'09上同时进行，主要讨论的就是开源数据挖掘工具的议题。OSDM09的网址为：http://osdm09.togaware.com/。</FONT></P>
<P><STRONG><FONT size=4>开源的数据挖掘工具（Open-Source Tools for Data Mining）<BR></FONT></STRONG>=======================================================<BR>Blaz Zupan, PhD, Janez Demsar, PhD (编译：IDMer)</P>
<P>数据挖掘软件的历史并不长，甚至连“数据挖掘”这个术语也只是在上世纪九十年代中期才正式提出，它融合了统计学、机器学习、数据可视化以及知识工程等研究领域的内容，在数据探索和模型推断等方面已经相当成熟。和现在相比，那时的数据挖掘软件还显得很笨拙，一般只提供了命令行界面。对于众多没有计算机科学背景的用户来说，还是太难用了。</P>
<P>现在的商用数据挖掘软件已经很成熟了，也提供易用的可视化界面，集成了数据处理、建模、评估等一整套功能。尽管开源的数据挖掘工具在稳定性和成熟性上可能都无法跟商用数据挖掘软件相比<FONT color=#0000ff>（IDMer：而且开源数据挖掘工具在性能上和售后支持上也无法提供让商业用户放心的保证）</FONT>，但有些开源工具还是做得不错的，用户可以选择它来做一些相对不那么重要的分析挖掘工作。</P>
<P>本文对开源数据挖掘工具的演进过程进行了简单回顾，并挑选了一些比较优秀的开源挖掘工具，供大家选择。</P>
<P><STRONG>开源数据挖掘工具的演进过程</STRONG><BR>--------------------------</P>
<P>从上世纪八十年代起就出现了早期的模型推断和机器学习程序，它们一般都是以命令行的方式执行（从UNIX或DOS的命令行启动），用户在命令中指定输入数据文件名和算法相关参数。广为人知的分类树归纳算法，C4.5，就是这种程序（C4.5的源程序参见http://www.rulequest.com/Personal）。同时还出现了基于规则的学习算法，例如AQ和CN2。这些程序大多被用在医疗领域，比如癌症的诊断和预测。<BR>这些程序一般并不包括数据抽样等处理功能，用户通常是使用一些脚本语言（例如Perl）来做这些事情。同时，一些研究团体还开发了程序库（用于支持数据格式共享、建模评估和报表功能），例如MLC++，就是用C++编写的机器学习程序库。</P>
<P>命令行界面让用户很难对数据进行交互式分析，而且文本格式的输出也不够直观。数据挖掘工具接下来的发展，就是内置数据可视化并强化交互功能。在上世纪九十年代中期，Silicon Graphics就收购了MLC++，并将其开发成为MineSet。MineSet几乎可以称为当时最全面的数据挖掘平台。Clementine也是当时非常流行的商用数据挖掘软件，在界面易用性上非常突出。</P>
<P>现在的开源数据挖掘软件，大多采用可视化编程的设计思路<FONT color=#0000ff>（IDMer：就是用图形化的方法，来建立整个挖掘流程）</FONT>。之所以这么做，是因为它能足够灵活和易用，更适合缺乏计算机科学知识的用户。</P>
<P>在分析软件中，灵活性和可扩展性是非常重要的，它允许你可以开发和扩展新的挖掘算法。在这个方面，Weka<FONT color=#0000ff>（IDMer：它几乎是开源数据挖掘软件的代表）</FONT>就提供了文档全面的Java函数和类库，非常适合扩展。当然，您首先需要充分了解Weka的架构，并掌握Java编程技术。另一个很有名的开源软件，R，则采用了相对不同的思路。R提供了丰富的统计分析和数据挖掘功能，它的内核是用C来实现的。但如果你想用R开发新的挖掘算法，那么你并不需要用C语言来开发，而是使用R软件自有的脚本语言来开发。采用脚本语言的好处在于速度<FONT color=#0000ff>（IDMer：这里指的是开发新算法的时间会缩短，因为脚本语言相对来说更高级更简单）</FONT>、灵活（可以直接通过脚本调用挖掘软件中复杂的功能函数）、可扩展性（可以通过接口来调用其它数据挖掘软件的功能）。当然，图形化的界面更容易使用，但使用脚本语言来开发新算法则可以满足一些特定分析需求。</P>
<P><STRONG>开源数据挖掘工具箱－期望的功能</STRONG><BR>------------------------------</P>
<UL>
<LI>提供一组基本的统计工具，用于对数据进行常规探索； 
<LI>多种数据可视化技术，例如histograms, scatterplots, distribution charts, parallel coordinate visualizations, mosaic and sieve diagrams等等； 
<LI>标准的数据处理组件，包括querying from databases, case selection, feature ranking and subset selection, and feature discretization等等； 
<LI>无指导的数据分析技术，比如principal component analysis, various clustering techniques, inference of association rules, and subgroup mining techniques等等； 
<LI>有指导的数据分析技术，比如classification rules and trees, support vector machines, naive Bayesian classifiers, discriminant analysis等等； 
<LI>模型评估和评分工具，包括对结果的图形化展示（比如ROC曲线和lift图）； 
<LI>推断模型的可视化功能<FONT color=#3300ff>（IDMer：例如用树状结构来显示训练好的决策树，用气泡图来显示聚类，用网络图来显示关联等等）</FONT>； 
<LI>提供探索型数据分析环境 
<LI>可以把模型保存为标准格式（例如PMML），以便进行共享和移植 
<LI>提供报表功能，可以生成分析报告，并允许保存用户的备注或说明</LI></UL>
<P><STRONG>几款优秀的开源数据挖掘工具</STRONG><BR>--------------------------</P>
<P>本文只对几种流行的开源数据挖掘平台进行了检视，比如Weka和R等。如果您想找寻更多的开源数据挖掘软件，可以到KDnuggets和Open Directory上查看。为了评测这些软件，我们用了UCI Machine Learning Repository上的心脏病诊断数据集。</P>
<P><STRONG>R</STRONG></P>
<P>R (http://www.r-project.org) 是用于统计分析和图形化的计算机语言及分析工具，为了保证性能，其核心计算模块是用C、C++和Fortran编写的。同时为了便于使用，它提供了一种脚本语言，即R语言。R语言和贝尔实验室开发的S语言类似。R支持一系列分析技术，包括统计检验、预测建模、数据可视化等等。在CRAN(http://cran.r-project.org) 上可以找到众多开源的扩展包。<BR>R软件的首选界面是命令行界面，通过编写脚本来调用分析功能。如果缺乏编程技能，也可使用图形界面，比如使用R Commander(http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/)或Rattle(<A href="http://rattle.togaware.com/"><FONT color=#000000 size=2>http://rattle.togaware.com</FONT></A>)。</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1802.img.pp.sohu.com.cn/images/blog/2008/12/16/16/27/11ee7b11673g214.jpg" border=0></P>
<P><STRONG>Tanagra</STRONG></P>
<P>Tanagra (http://eric.univ-lyon2.fr/wricco/tanagra/) 是使用图形界面的数据挖掘软件，采用了类似Windows资源管理器中的树状结构来组织分析组件。Tanagra缺乏高级的可视化能力，但它的强项是统计分析，提供了众多的有参和无参检验方法。同时它的特征选取方法也很多。</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1851.img.pp.sohu.com.cn/images/blog/2008/12/16/16/28/11ee7b2323cg214.jpg" border=0></P>
<P><STRONG>Weka</STRONG></P>
<P>Weka (Waikato Environment for Knowledge Analysis, http://www.cs.waikato.ac.nz/ml/weka/) 可能是名气最大的开源机器学习和数据挖掘软件。高级用户可以通过Java编程和命令行来调用其分析组件。同时，Weka也为普通用户提供了图形化界面，称为Weka KnowledgeFlow Environment和Weka Explorer。和R相比，Weka在统计分析方面较弱，但在机器学习方面要强得多。在Weka论坛(http://weka.sourceforge.net/wiki/index.php/Related_Projects) 可以找到很多扩展包，比如文本挖掘、可视化、网格计算等等。很多其它开源数据挖掘软件也支持调用Weka的分析功能。</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1802.img.pp.sohu.com.cn/images/blog/2008/12/16/16/28/11ee7b2dcf7g214.jpg" border=0></P>
<P><STRONG><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1861.img.pp.sohu.com.cn/images/blog/2008/12/17/9/10/11eeb48025cg214.jpg" border=0><BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1802.img.pp.sohu.com.cn/images/blog/2008/12/17/9/8/11eeb45b1c4g214.jpg" border=0><BR>YALE</STRONG> <FONT color=#0000ff>（IDMer：现在已经更名为RapidMiner）</FONT></P>
<P>YALE (Yet Another Learning Environment, http://rapid-i.com) 提供了图形化界面，采用了类似Windows资源管理器中的树状结构来组织分析组件，树上每个节点表示不同的运算符（operator）。YALE中提供了大量的运算符，包括数据处理、变换、探索、建模、评估等各个环节。YALE是用Java开发的，基于Weka来构建，也就是说它可以调用Weka中的各种分析组件。</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1841.img.pp.sohu.com.cn/images/blog/2008/12/16/16/29/11ee7b05369g213.jpg" border=0></P>
<P><STRONG>KNIME</STRONG></P>
<P>KNIME (Konstanz InformationMiner, http://www.knime.org)是基于Eclipse开发环境来精心开发的数据挖掘工具。无需安装，方便使用<FONT color=#0000ff>（IDMer：呵呵，大家喜欢的绿色版）</FONT>。和YALE一样，KNIME也是用Java开发的，可以扩展使用Weka中的挖掘算法。和YALE不同点的是，KNIME采用的是类似数据流（data flow）的方式来建立分析挖掘流程<FONT color=#0000ff>（IDMer：这个我喜欢，和SAS EM或SPSS Clementine等商用数据挖掘软件的操作方式类似）</FONT>。挖掘流程由一系列功能节点（node）组成，每个节点有输入/输出端口（port），用于接收数据或模型、导出结果<FONT color=#0000ff>。（IDMer：感觉KNIME比Weka的KnowledgeFlow更好用，连接节点时很方便，直接用鼠标拖拽连接端口即可。而Weka中则需要在节点上按鼠标右键，再选择后续节点，比较麻烦，刚开始使用时找了半天才知道怎么连）</FONT><BR>KNIME中每个节点都带有交通信号灯，用于指示该节点的状态（未连接、未配置、缺乏输入数据时为红灯；准备执行为黄灯；执行完毕后为绿灯）。在KNIME中有个特色功能——HiLite，允许用户在节点结果中标记感兴趣的记录，并进一步展开后续探索。</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1821.img.pp.sohu.com.cn/images/blog/2008/12/16/16/0/11ee7b42e3eg214.jpg" border=0></P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1821.img.pp.sohu.com.cn/images/blog/2008/12/16/16/2/11ee7b62bdcg214.jpg" border=0></P>
<P><STRONG>Orange</STRONG></P>
<P>Orange (http://www.ailab.si/orange)是类似KNIME和Weka KnowledgeFlow的数据挖掘工具，它的图形环境称为Orange画布（OrangeCanvas），用户可以在画布上放置分析控件（widget），然后把控件连接起来即可组成挖掘流程。这里的控件和KNIME中的节点是类似的概念。每个控件执行特定的功能，但与KNIME中的节点不同，KNIME节点的输入输出分为两种类型（模型和数据），而Orange的控件间可以传递多种不同的信号，比如learners, classifiers, evaluation results, distance matrices, dendrograms等等。Orange的控件不象KNIME的节点分得那么细，也就是说要完成同样的分析挖掘任务，在Orange里使用的控件数量可以比KNIME中的节点数少一些。Orange的好处是使用更简单一些，但缺点是控制能力要比KNIME弱。<BR>除了界面友好易于使用的优点，Orange的强项在于提供了大量可视化方法，可以对数据和模型进行多种图形化展示，并能智能搜索合适的可视化形式，支持对数据的交互式探索。<BR>Orange的弱项在于传统统计分析能力不强，不支持统计检验，报表能力也有限。Orange的底层核心也是采用C++编写，同时允许用户使用Python脚本语言来进行扩展开发(参见<A href="http://www.scipy.org/"><FONT color=#000000 size=2>http://www.scipy.org</FONT></A>)。</P>
<P>&nbsp;<IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1841.img.pp.sohu.com.cn/images/blog/2008/12/16/16/3/11ee7b1dfd6g215.jpg" border=0></P>
<P><STRONG><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1821.img.pp.sohu.com.cn/images/blog/2008/12/16/16/4/11ee7b7a090g214.jpg" border=0><BR>GGobi</STRONG><BR>数据可视化是数据挖掘的重要组成部分， GGobi (<A href="http://www.ggobi.org/"><FONT color=#000000 size=2>http://www.ggobi.org</FONT></A>)就是用于交互式可视化的开源软件，它使用brushing的方法。GGobi可以用作R软件的插件，或者通过Perl、Python等脚本语言来调用。</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1851.img.pp.sohu.com.cn/images/blog/2008/12/16/16/4/11ee7b8646bg214.jpg" border=0></P>
<P><STRONG>结论</STRONG><BR>----<BR>以上介绍的几款软件都是优秀的开源数据挖掘软件，各有所长，同时也各有缺点。读者可以结合自己的需求来进行选择，或者组合使用多个软件。对于普通用户可以选用界面友好易于使用的软件，对于希望从事算法开发的用户则可以根据软件开发工具不同（Java、R、C++、Python等）来选择相应的软件。以上这几款软件（除了GGobi）基本上都提供了我们期望的大部分功能。<BR><FONT color=#0000ff>（IDMer：我尝试了以上这几种开源软件，Weka很有名但用起来并不方便，界面也简单了点；RapidMiner现在流行的势头在上升，但它的操作方式和商用软件差别较大，不支持分析流程图的方式，当包含的运算符比较多的时候就不容易查看了；KNIME和Orange看起来都不错，Orange界面看上去很清爽，但我发现它不支持中文。我的推荐是KNIME，同时安装Weka和R扩展包。）<BR>（IDMer：我的点评纯属个人意见，欢迎大家批评交流。在我的实际工作中使用开源挖掘工具并不多，大部分时候都是在使用SAS Enterprise Miner。）</FONT></P></DIV></DIV></DIV></DIV></DIV>]]></description>
</item><item>
<title><![CDATA[SAS：商业智能从BI走向BA]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=41607</link>
<author>idmer</author>
<pubDate>2008/12/8 15:59:58</pubDate>
<description><![CDATA[<DIV id=articleInnerContent>
<DIV id=contentLabelBox><SPAN><FONT color=#ff0000><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" height=200 alt="" src="http://imnexus.com/images/business-analytics.jpg" width=300 border=0>本文是我最近在《信息周刊》上发表的2008年“技术盘点和展望”专稿，对BI（商业智能）的发展方向和技术进行初步探讨，欢迎大家交流意见。</FONT></SPAN></DIV>
<DIV class=item>
<DIV id=entry>
<DIV class=item-body>
<DIV class=item-content id=main-content>
<P><SPAN>商业智能技术正在走上面向商业分析的整合之路</SPAN><BR><SPAN>《信息周刊》网络版&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;张磊，SAS公司高级咨询顾问<BR>发表时间：2008-12-8</SPAN> </P>
<P>摘自：<A href="http://www.informationweek.com.cn/iarticle/49871.html"><FONT color=#000000 size=2>http://www.informationweek.com.cn/iarticle/49871.html</FONT></A></P>
<P><FONT size=2></FONT></P><FONT size=2>
<HR>
</FONT>
<P></P>
<P><FONT size=2></FONT></P>
<P>当报表、多维分析等传统的商业智能（BI）技术已经被大家熟知之后，转而代之的是更高级而易用的商业分析（Business Analytics,下称 BA）技术。</P>
<P>在国际数据公司（IDC）对2008~2012年的BI工具预测中，为BA软件给出了一个清晰的范围，它包括两大部分：数据仓库平台和绩效管理工具及应用。数据仓库平台中包含数据仓库管理工具和ETL、数据质量工具；绩效管理工具及应用则包括了基于数据仓库或统一数据平台之上的分析功能，例如财务绩效和战略管理、供应链分析、劳动力分析、客户关系（CRM）分析应用、服务营运分析、生产规划、商业智能（BI）工具（查询、报表、多维分析、仪表盘）、高级分析（数据挖掘和统计）等。</P>
<P>商业分析不再只被少数统计分析专家使用，已经融入了人们的日常生活之中。企业管理层上班的第一件事也许就是打开营运绩效的仪表盘来查看企业运营是否正常；员工出差去订机票时，航空公司正不断分析优化航线；午餐时的餐厅也会分析食客的偏好和需要来管理和优化原料的供应；业余时间去逛超市，超市已经根据商品销售的关联分析重新布置了货架，让顾客更容易发现和购买所需的商品。</P>
<P>2007年的全球BA市场份额为214亿美元，其中数据仓库平台为63亿美元，绩效管理工具及应用为151亿美元。在绩效管理工具及应用中，BI工具占据了占据了接近半壁江山，市场份额达到69.98亿美元，其他从高到低依次为供应链分析（38.81亿）、财务绩效和战略管理（19.52亿）、CRM分析应用（14.79亿）等。</P>
<P>从BI到BA的整合之路，摘下玄虚的“智能”招牌，在报表、OLAP之上整合统计分析、数据挖掘等高级分析功能，踏踏实实地用严谨而科学的分析来解决业务上诸如营销管理优化、作业成本管理、战略绩效管理、风险管理的问题，将会是BI未来的发展方向。谷歌公司（Google）上的搜索也给出了有力的例证，搜索“business intelligence”返回4890万条结果，而搜索“analytic”则返回了1亿3100万条结果。根据IDC的预测，未来5年BA软件市场的年增长率预计为10.3%。</P>
<P>展望2009年，从传统的以报表和多维分析为主的BI，迈向整合了统计分析、数据挖掘等高级分析技术的BA，是一个主流的发展方向，而能提供一站式解决方案的厂商会进一步扩大市场份额。在此基础上，我们预计以下应用趋势会浮现并得到加强：</P>
<P>*功能完善的报表工具依然是不可或缺的，但会进一步增强和仪表盘、可视化图形分析的集成；</P>
<P>*支持鼠标拖拽点击的商业智能工作区（BI Workspace）会为用户提供一个综合的分析平台，提供了包括即席查询、数据变换、探索分析等诸多功能；</P>
<P>*预测型建模工具的应用将更加广泛，为企业提供更有前瞻性的行动建议，同时会与渠道管理、营销自动化等紧密联系；</P>
<P>*通过绩效管理和商业行为监控（BAM），数据处理和分析的实时性更加强化，及时发现业务中的问题并快速反应；</P>
<P>*统一的元数据管理将变得越来越重要，数据整合、数据管理、商业智能和分析智能等商业分析组件产品的元数据必须要集中到中央元数据库中，这对分析系统的可用性、运行维护的成本和分析能力的可扩展性都将起到决定性的影响。</P>
<P>总而言之，整合的产品，整合的方案，整合的平台，对于BI市场而言，前方的BA路标已经越来越清晰，而这条整合之路也是前景光明。</P>
<P><STRONG>2008年《</STRONG><A href="http://www.informationweek.com.cn/" target=_balnk><FONT color=#000000 size=2>信息周刊</FONT></A><STRONG>》“技术盘点和展望”专稿</STRONG></P>
<P><EM>作者简介：张磊目前为赛仕软件有限公司（SAS）高级咨询顾问，在加入SAS之前，曾任中国百胜餐饮集团（Yum! China）开发部开发资讯经理和NCR(中国)有限公司高级经理，成功实施了20多个数据挖掘专题，建立模型超过40个。</EM></P></DIV></DIV></DIV></DIV></DIV>]]></description>
</item><item>
<title><![CDATA[数据分析/数据挖掘人员的专业社交网络站点]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=41496</link>
<author>idmer</author>
<pubDate>2008/12/3 23:18:27</pubDate>
<description><![CDATA[<P><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" height=300 alt="" src="http://www.apollomediablog.com/wp-content/uploads/2008/06/social-networks.jpg" width=200 border=1>在最近一期的KDnuggets News上发起了关于“数据分析/数据挖掘人员的专业社交网络站点”投票，其中包含了如下这些社交网络：</P>
<LI>Facebook 
<LI>a Facebook analytic group 
<LI>LinkedIn 
<LI>LinkedIn analytics group 
<LI>MySpace 
<LI>Twitter 
<LI>AnalyticBridge 
<LI>Other social sites 
<P>我有时会上去看的可能就是LinkedIn，感觉那里的专业人士比较多，同时也能把自己的同事、朋友加入自己的社交网络中。至于Facebook、MySpace这些大家熟知的站点，反而因为太流行太杂的原因，我反而不太喜欢。Twitter上似乎也有不少牛人，我看到的一些有价值的文章也是来自这个站点。</P>
<P>当然，我现在最常用来跟踪数据挖掘领域内动态信息的方法，还是使用Google Reader订阅了一些不错的RSS Feeds，平时经常登录上去翻阅一下。</P>
<P>KDnuggets上列出了一些网站，大家有兴趣可以看看：</P>
<LI><A href="http://www.analyticbridge.com/"><FONT color=#000000 size=2>Analytic Bridge</FONT></A>, created by Vincent Granville. 
<LI><A href="http://www.facebook.com/"><FONT color=#000000 size=2>Facebook</FONT></A> groups: 
<UL>
<LI><A href="http://www.facebook.com/group.php?gid=17647299304"><FONT color=#000000 size=2>Facebook group: Analytics, Data Mining, Predictive Modeling, Artificial Intelligence</FONT></A>. 
<LI><A href="http://www.facebook.com/group.php?gid=5582633474"><FONT color=#000000 size=2>Facebook group: Data Mining / Machine Learning / AI</FONT></A>. 
<LI><A href="http://www.facebook.com/group.php?gid=4837714685"><FONT color=#000000 size=2>Facebook group: Text Mining &amp; Text Analytics Professionals</FONT></A>. 
<LI><A href="http://www.facebook.com/"><FONT color=#000000 size=2>Facebook Users Against Personally Targeted Advertising and Data Mining</FONT></A> </LI></UL>
<LI><A href="http://www.linkedin.com/"><FONT color=#000000 size=2>LinkedIn</FONT></A> groups: 
<UL>
<LI><A href="http://www.linkedin.com/groups?gid=62438"><FONT color=#000000 size=2>LinkedIn: Business Analytics</FONT></A> 
<LI><A href="http://www.linkedin.com/groups?gid=49162"><FONT color=#000000 size=2>LinkedIn: Business Intelligence &amp; Analytics Group</FONT></A>. 
<LI><A href="http://www.linkedin.com/groups?gid=22313"><FONT color=#000000 size=2>LinkedIn: Data &amp; Text Analytics Professionals</FONT></A> 
<LI><A href="http://www.linkedin.com/groups?gid=35222"><FONT color=#000000 size=2>LinkedIn: DataShaping Advanced Analytics</FONT></A>. 
<LI><A href="http://www.linkedin.com/groups?gid=70219"><FONT color=#000000 size=2>LinkedIn: Machine Learning Connection</FONT></A>. 
<LI><A href="http://www.linkedin.com/groups?gid=160888"><FONT color=#000000 size=2>LinkedIn: ACM SIGKDD</FONT></A>. </LI></UL></LI>]]></description>
</item><item>
<title><![CDATA[这就是经济，愚蠢的经济！]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=40791</link>
<author>idmer</author>
<pubDate>2008/10/24 13:48:04</pubDate>
<description><![CDATA[<P><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" height=200 alt="" src="http://awesome.goodmagazine.com/goodsheet/images/goodSheet_006_Economy.jpg" width=300 border=0>来源：<A href="http://awesome.goodmagazine.com/goodsheet/goodsheet006economy.html"><FONT color=#000000 size=2>http://awesome.goodmagazine.com/goodsheet/goodsheet006economy.html</FONT></A></P>
<P>编译：IDMer（数据挖掘者）</P>
<P><STRONG>这就是经济，愚蠢的经济！(IT'S THE ECONOMY, STUPID!)</STRONG></P>
<P>美元已经不再强势，食品和石油的价格却高高在上。我们的国家（编者注：美国）的大手大脚让它已经欠下了上万亿的国债。大多数悲观绝望的报告中并没有指出前景会如何——从经济发展的历史数据中可以看到它的起起落落。本文向读者展示了美国这台喜怒无常的经济机器是如何运作的，并让您近距离观察它的现状。</P>
<P><FONT color=#0000ff><STRONG>文章导读（IDMer）：</STRONG><BR></FONT>文章以图片为主，三条曲线鲜明地反映了从1920年至今美国经济发展的走势，这三条曲线是做过通货膨胀调整的美国国债（U.S. National Debt, in inflation-adjusted 2007 dollars）、按现有美元计算的美国国债（U.S. National Debt, in actual dollars）、国民生产总值（GDP）。</P>
<P>从图上我们可以看出，美国的国债在1950~1980年间保持平稳，而在上世纪80年代后，美国国债增长迅猛。从1980年的2.3万亿美元暴涨到现在的9.6万亿美元，翻了两翻（有点象中国的GDP，呵呵）。当然美国的GDP也在持续增长，而且看起来增速还很稳定，从1940年（二战后）的1.5万亿增长到目前的13.8万亿。</P>
<P>文中右上方用粗体字列出了一个问题：是谁拥有美国？<BR>按照各个国家持有美国国债的多少，从高到低排列，前五名依次为：日本、中国、英国、石油输出国*、巴西。<BR>（IDMer：我最近在看一本书——《货币战争》。从这本书里你可以发现，持有大笔美国国债并非是值得欣喜的事情，恰恰相反，更应该值得担忧。对于美元这种债务型货币，因为它脱离了金本位，是很容易被国际银行家集团操纵，用来实施对其它国家的经济打击和掠夺，实际上是一场没有硝烟的战争）</P>
<P>最后，在图形的右侧，作者谈到如何降低美国的国债来拯救经济。解决方法看起来满有意思，他号召民众给美国公共债务局寄支票。不知道这个方法可行不？也许在韩国可以，可是在美国，我看悬。</P>]]></description>
</item><item>
<title><![CDATA[SAS中国网站－资源中心]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=40360</link>
<author>idmer</author>
<pubDate>2008/9/28 11:01:11</pubDate>
<description><![CDATA[<DIV class=featureText>
<P><STRONG><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" alt="" src="http://www.sas.com/offices/asiapacific/china/news/images/resource_ctr.jpg" border=0>资源中心</STRONG><BR><FONT size=2>想要了解白皮书或者分析人士的最新观点？所有这些内容尽在这里。 通过下列资源了解SAS如何帮助您解决业务难题。<BR></FONT></P></DIV>
<DIV class=featureClear></DIV>
<DIV class=clearleft>&nbsp;</DIV><BR>
<TABLE cellSpacing=0 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD vAlign=top align=left width="50%">
<TABLE cellSpacing=0 cellPadding=12 width="100%" border=0>
<TBODY>
<TR>
<TD vAlign=top align=left><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/news/view/index.html">分析人士观点</A></B> <SPAN class=newsText>(来自行业分析公司)</SPAN> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A title="[PDF: 820KB] Launches Adobe Reader" href="http://www.sas.com/corporate/annual-report-07.pdf">年报</A></B> <SPAN class=newsText>(PDF: 820KB)</SPAN> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <A title="External Link: blogs.sas.com" href="http://blogs.sas.com/"><STRONG>SAS 博客</STRONG></A> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <A title="External Link: support.sas.com" href="http://support.sas.com/publishing/index.html"><STRONG>书店</STRONG></A> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/success/index.html">客户成功案例</A></B> <SPAN class=newsText>(400多例)</SPAN> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/resources/itours.html">演示与互动展示</A></B> <SPAN class=newsText>(30多个)</SPAN> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/news/cn_newsletter/index.html">电子快讯</A></B> <SPAN class=newsText>(10条)</SPAN> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/events/index.html">活动</A></B> </P></TD></TR></TBODY></TABLE></TD>
<TD width=1 bgColor=#d1d1d1><IMG height=4 alt="" src="http://www.sas.com/images/global/clear.gif" width=1></TD>
<TD width=1 background=/images/bkgrd_tile.gif><IMG height=4 alt="" src="http://www.sas.com/images/global/clear.gif" width=1></TD>
<TD width=1 bgColor=#d1d1d1><IMG height=4 alt="" src="http://www.sas.com/images/global/clear.gif" width=1></TD>
<TD vAlign=top align=left width="50%">
<TABLE cellSpacing=0 cellPadding=12 width="100%" border=0>
<TBODY>
<TR>
<TD vAlign=top align=left>
<P><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/news/feature/index.html">新闻报摘与新闻稿</A></B> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/resources/podcast/index.html">播客</A></B> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/rss/index.html">RSS Feeds</A></B> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/news/SASview/2007/2007q3/2007q3.html"><EM>sascom</EM>在线杂志</A></B> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/news/presscenter/screenshots.html">屏幕截图</A></B> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <A title="External Link: support.sas.com" href="http://support.sas.com/training/index.html"><STRONG>培训</STRONG></A> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/apps/webcast/index.jsp?code=">网上研讨</A></B> <SPAN class=newsText>(70多个)</SPAN> 
<P class=squish13pix><IMG height=7 alt="" src="http://www.sas.com/images/gray_doublearrow.gif" width=7 align=middle border=0> <B><A href="http://www.sas.com/offices/asiapacific/china/resources/whitepapers.html">白皮书</A></B> <SPAN class=newsText>(100多份)</SPAN> </P></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE><!-- 3-column table ends--><BR><STRONG>您是否属于SAS客户?</STRONG> <BR>您可以通过我们的客户支持中心（<A title="External Link: support.sas.com" href="http://support.sas.com/">support.sas.com</A> ）来获取技术信息、支持，查找用户群，下载软件，获取样本，等等。]]></description>
</item><item>
<title><![CDATA[韩家炜－《高级数据挖掘：原理、算法与应用》课程讲稿]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=38914</link>
<author>idmer</author>
<pubDate>2008/8/13 23:45:22</pubDate>
<description><![CDATA[<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" height=100 alt="" src="http://www.iipl.fudan.edu.cn/resource/dg3.jpg" width=600 border=0>龙星计划课程——《高级数据挖掘：原理、算法与应用》于2008年7月14日—18日在复旦大学开讲，由美国依里诺大学阿贝纳香宾分校<STRONG>韩家炜</STRONG>教授主讲。 <BR>网址： <A href="http://www.iipl.fudan.edu.cn/ds08/index.htm"><FONT color=#000000 size=2>http://www.iipl.fudan.edu.cn/ds08/index.htm</FONT></A> </P>
<P>课程讲稿请登陆 <A href="http://www.cs.uiuc.edu/homes/hanj/dragon08/index.htm"><FONT color=#000000 size=2>http://www.cs.uiuc.edu/homes/hanj/dragon08/index.htm </FONT></A>下载查看。</P>
<P>The course introduces the principles, algorithms, and applications of advanced data mining, including algorithms, methods, implementations and applications of classification, clustering, association and correlation analysis, multidimensional and OLAP analysis, mining sequential and structured data, stream data, text data, Web data, spatiotemporal data, biomedical data and other forms of complex data. </P>
<P>Slides: <A href="http://www.cs.uiuc.edu/homes/hanj/dragon08/index.htm"><FONT color=#000000 size=2>http://www.cs.uiuc.edu/homes/hanj/dragon08/index.htm</FONT></A> </P>
<P>MAJOR TOPICS:<BR>1.General overview of data mining<BR>2.Advanced data integration and preprocessing<BR>3.Data warehouse, data cube, OLAP and multidimensional analysis<BR>4.Frequent pattern and correlation analysis<BR>5.Classification and predictive modeling<BR>6.Cluster analysis<BR>7.Mining sequence and time-series data<BR>8.Mining graphs and structured patterns <BR>9.Link analysis and mining information networks<BR>10.Stream data mining<BR>11.Mining spatial, spatiotemporal, RFID data, trajectories, and moving objects<BR>12.Mining multimedia, text, and web data<BR>13.Data mining applications: Software engineering and bioinformatics<BR>14.Other issues on data mining: visual data mining and privacy-preserving data mining<BR>15.Research frontiers and social impacts of data mining</P>]]></description>
</item><item>
<title><![CDATA[统计学书籍推荐]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=38752</link>
<author>idmer</author>
<pubDate>2008/8/10 23:23:33</pubDate>
<description><![CDATA[<P><BR><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px; WIDTH: 327px; HEIGHT: 223px" height=274 alt="" src="http://www.core.org.cn/NR/rdonlyres/Global/D/DB9C7E42-0911-4C15-A10C-9353D12197B2/0/chp_probability_stat.jpg" width=374 border=0></P>
<P>主要内容来自<A href="http://www.cos.name/bbs/read.php?tid=5362" target=_blank rel=nofollow>http://www.cos.name/bbs/read.php?tid=5362</A> <BR>　　 <BR>　　统计学读物推荐 <BR>　　 <BR><STRONG>　　一、统计学基础部分 <BR></STRONG>　　 1、《统计学》 David Freedman等著，魏宗舒，施锡铨等译 中国统计出版社 　　 据说是统计思想讲得最好的一本书，读了部分章节，受益很多。整本书几乎没有公式，但是讲到了统计思想的精髓。 <BR>　　 2、《Mind on statistics(英文版）》 机械工业出版社 <BR>　　 只需要高中的数学水平，统计的扫盲书。有一句话影响很深： Mathematics as to statistics is something like hammer, nails, wood as to a house, it's just the material and tools but not the house itself。 <BR>　　3、《Mathematical Statistics and Data Analysis（英文版.第二版）》 机械工业出版社 <BR>　　看了就发现和国内的数理统计树有明显的不同。这本书理念很好，讲了很多新的东西，把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。 <BR>　　4、《Business Statistics a decision making approach（影印版）》 中国统计出版社 <BR>　　在实务中很实用的东西，虽然往往为数理统计的老师所不屑 <BR>　　5、《Understanding Statistics in the behavioral science（影印版）》 中国统计出版社 <BR>　　和上面那本是一个系列的。老外的书都挺有意思的 <BR>　　6、《探索性数据分析》中国统计出版社 和第一本是一个系列的。大家好好看看陈希儒老先生做的序，可以说是对中国数理统计的一种反思。 <BR>　　7、 数理统计引论 <BR>　　著译者： 陈希孺 <BR>　　出版者：科学出版社 <BR>　　《数理统计学简史》陈希孺 <BR>　　8 《概率论与数理统计教程》魏宗舒 <BR>　　 <BR>　　<STRONG>二、回归部分 <BR></STRONG>　　1、《应用线性回归》 中国统计出版社 <BR>　　还是著名的蓝皮书系列，有一定的深度，道理讲得挺透的。看看里面对于偏回归系数的说明，绝对是大开眼界啊！非常精彩的书 <BR>　　2、《Regression Analysis by example (3rd Ed影印版)》 <BR>　　这是偶第一本从头到底读完的原版统计书，太好看了。那张虚拟变量写得比小说都吸引人。没什么推导，甚至说“假定你有统计软件可以算出结果”，主要就是将分析，怎么看图，怎么看结果。看完才觉得回归真得很好玩 <BR>　　3、《Logistics回归模型——方法与应用》 王济川 郭志刚 高等教育出版社 不多的国内的经典统计教材。两位都是社会学出身，不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多，中文写的书，但是明显老外写书的风格 <BR>　　 <BR>　　<STRONG>三、多元</STRONG> <BR>　　0、《多元统计分析引论》张尧庭，方开泰著 科学出版社 <BR>　　1、《应用多元分析（第二版）》 王学民 上海财经大学出版社 <BR>　　现在好像就是用的这本书，但是请注意，这本书的亮点不是推导，而是后面和SAS结合的部分，以及其中的一些想法（比如P99 n对假设检验的影响，绝对是统计的感觉，不是推推公式就能感觉到的）。这是一本国内很好的多元统计教材。 <BR>　　2、《Analyzing Multivariate Data（英文版）》 Lattin等著 机械工业出版社 这本书有很多直观的感觉和解释，非常有意思。对数学要求不高，证明也不够好，但的确是“统计书”，不是数学书。 <BR>　　3、《Applied Multivariate Statistical Analysis (5th Ed影印版)》 Johnson &amp; Wichem 著 中国统计出版社 <BR>　　个人认为是国内能买到的最好的多元统计书了。Amazon 上有人评论，评价很高的。不过据王学民老师说，这本书的证明还是有不太清楚，老外实务可以，证明实在不咋的，呵呵 <BR>　　 <BR>　　<STRONG>四、时间序列</STRONG> <BR>　　1、《商务和经济预测中的时间序列模型》 弗朗西斯著 <BR>　　Amazon 上五星推荐的书，讲了很多很新的东西也非常实用。我看完才知道，原来时间序列不知有AR(1) MA(1)啊，哈 <BR>　　2、《Forecasting and Time Series an applied approach(third edition)》 Bowerman &amp; Connell 著 <BR>　　本书的主讲Box-Jenkins(ARIMA)方法，附上了SAS和Minitab程序 <BR>　　 <BR>　　<STRONG>五、抽样</STRONG> <BR>　　1、《抽样技术》 科克伦著 张尧庭译 <BR>　　绝对是该领域最权威，最经典的书了。王学民老师说：这本书不是那么好懂的，数学系的人，就算看得懂每个公式，未必能懂它的意思（不是数学系的人，还是别看了吧）。 <BR>　　2、《Sampling: Design and Analysis（影印版)》 Lohr著 中国统计出版社 <BR>　　讲了很多很新的方法，无应答，非抽样误差，再抽样，都有讨论。也很不好懂，当时偶是和《Advance Microeconomic <BR>　　Theory》一起看的，后者被许多人认为是梦魇，但是和前者一比，好懂多了。主要还是理念上的差距。我们的统计思想和数据感觉有待加强啊 <BR>　　 <BR>　　<STRONG>六、软件及其他</STRONG> <BR>　　1、《SAS软件与应用统计分析》 王吉利 张尧庭 主编 <BR>　　好书啊！！！！ <BR>　　2、《SAS V8基础教程》 汪嘉冈编 中国统计出版社 <BR>　　主要讲编程，没怎么讲统计。如果想加强SAS编程可以考虑。 <BR>　　3、《SPSS11统计分析教程（基础篇）（高级篇）》 张文彤 北京希望出版社 <BR>　　当初第一次看这本书，发现怎么几乎都看不懂，尤其是高级篇，现在终于搞清楚了：） <BR>　　4、《金融市场的统计分析》 张尧庭著 广西师范大学出版社 <BR>　　张老师到底是大家，薄薄的一本书，言简意赅，把主要的金融模型都讲清楚了。看完会发现，分析金融单单数学模型还是纸上谈兵，必须加上统计模型和统计方法才能真正应用。本书用的多元统计（代数知识）比较深。 <BR>　　 <BR>　　<STRONG>其它</STRONG> <BR>　　Common Errors in Statistics : (and How to Avoid Them) <BR>　　Good P.I., Hardin J.W. <BR>　　John Wiley &amp; Sons; 2003; 240стр.; ISBN: 0471460680 <BR></P>]]></description>
</item><item>
<title><![CDATA[学车小记（一、法规学习）]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=38749</link>
<author>idmer</author>
<pubDate>2008/8/10 22:57:32</pubDate>
<description><![CDATA[
<P><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" alt="" src="http://1871.img.pp.sohu.com.cn/images/blog/2008/8/10/22/2/11c5340c958g215.jpg" border=0>家里买了小车，老婆是司机，经常开车送我上班。平时自己打车的时候通常坐在后排，告诉的哥要去哪里之后，就万事大吉，随他怎么走了。坐自己家的车就不同了，我要坐在副驾驶的位置，眼观六路，耳听八方，帮老婆留心着旁边的车流人流，前面的路面标线，关注着红绿灯的变化，比打车要忙活得多。不过随着老婆的车技越来越熟练，现在坐车已经要轻松多了。</P>
<P>轻松归轻松，也不能一直当坐车的大爷，更何况以后要出去自驾游或远行，还是要两个人换着开车才可以，所以我也就开始了学车的生活。</P>
<P>上上周末在东方时尚报名学车，上周末被驾校的老师疲劳轰炸了两天的交通法规，回来后就背呀背呀（记性不好，就只能多下苦功）。周三参加了法规考试，是在电脑上考试，出乎意料的很快很简单，一共100道题，11分钟做完，再用了9分钟检查，然后交卷——“祝您顺利通过法规考试：98分”，也就是说，我一共错了两道题。惭愧的是，我还是延续了从小到大一直的考试习惯——考完试立刻忘了自己考了些啥，所以也就不知道到底错了哪两道题。</P>
<P>学习交通法规时，认真做了笔记，这里顺便把一些总结贴出来，以为备忘；）</P>
<P>① 不同车型的年龄要求</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1861.img.pp.sohu.com.cn/images/blog/2008/8/10/22/3/11c5341aa0bg214.jpg" border=0></P>
<P>② 交警的手势信号（一共8种）</P>
<P><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1841.img.pp.sohu.com.cn/images/blog/2008/8/10/22/5/11c53436673g214.jpg" border=0><BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1841.img.pp.sohu.com.cn/images/blog/2008/8/10/22/6/11c5343bf08g213.jpg" border=0></P>
<P>③ 道路通行规定<BR>&nbsp;&nbsp; 限速<BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1804.img.pp.sohu.com.cn/images/blog/2008/8/10/22/12/11c5349f84bg214.jpg" border=0><BR>&nbsp;&nbsp; 安全车距、警告标志距离、停车距离<BR><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" alt="" src="http://1841.img.pp.sohu.com.cn/images/blog/2008/8/10/22/13/11c534b17a3g214.jpg" border=0><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" alt="" src="http://1861.img.pp.sohu.com.cn/images/blog/2008/8/10/22/14/11c534b6c70g213.jpg" border=0><IMG style="FLOAT: left; MARGIN: 0px 10px 10px 0px" alt="" src="http://1804.img.pp.sohu.com.cn/images/blog/2008/8/10/22/15/11c534d1472g214.jpg" border=0><BR><BR><BR>&nbsp;&nbsp; <BR>限高限宽<BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1851.img.pp.sohu.com.cn/images/blog/2008/8/10/22/16/11c534da303g213.jpg" border=0></P>
<P>④ 法律责任<BR>&nbsp;&nbsp; 刑事法律责任<BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1833.img.pp.sohu.com.cn/images/blog/2008/8/10/22/17/11c534efea0g214.jpg" border=0><BR>&nbsp;&nbsp; 行政处罚<BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1871.img.pp.sohu.com.cn/images/blog/2008/8/10/22/18/11c534f9d8eg214.jpg" border=0><BR>&nbsp;&nbsp; 罚款<BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1804.img.pp.sohu.com.cn/images/blog/2008/8/10/22/19/11c53503b4bg214.jpg" border=0><BR>&nbsp;&nbsp; 扣分<BR><IMG style="DISPLAY: block; MARGIN: 0px auto 10px; TEXT-ALIGN: center" alt="" src="http://1803.img.pp.sohu.com.cn/images/blog/2008/8/10/22/19/11c53509437g213.jpg" border=0></P>]]></description>
</item><item>
<title><![CDATA[Gartner: 2007年商业智能软件的市场增长达到13%]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=37731</link>
<author>idmer</author>
<pubDate>2008/7/13 23:27:25</pubDate>
<description><![CDATA[<P>译自：<A href="http://www.kdnuggets.com/news/2008/n13/21i.html">http://www.kdnuggets.com/news/2008/n13/21i.html</A><BR>By Jeff Kelly, 24 Jun 2008 | SearchDataManagement.com </P>
<P>根据Gartner公司的报告，2007年全球BI（商业智能）软件市场份额达到了51亿美元，比2006年增加了13%。<BR>但美国的BI软件开支则仅增加了5%，与其在2006年16%的增长相比下降明显，这主要是因为美国经济开始出现衰退迹象以及美元的持续走弱所致，次贷危机的影响明显。</P>
<P>最大的赢家是那些大的软件厂商，如SAP、IBM、Oracle和Microsoft，它们总的市场份额从2006年的20%，增加到2007年的66%。这种急剧增长主要是通过并购来实现的。在2007年1月份，SAP收购了BO（Business Object），IBM收购了Cognos。在2007年3月份，Oracle则收购了Hyperion。</P>
<P>合并之后，SAP和BO排名第一，占据了全球26.3的BI软件市场，比第二名（IBM和Cognos，市场份额为14.7%）高出了将近一倍。SAS为第三名，市场份额为14.5%。下表中的排名与此不同，是因为有些并购直到2008年才最终完成。</P>
<P>2007年全球BI厂商的营收排名 (单位：百万美元)</P>
<P>&nbsp; 
<TABLE cellSpacing=0 cellPadding=0 border=1>
<TBODY>
<TR>
<TD vAlign=top width=99>
<P align=left><B>公司</B></P></TD>
<TD vAlign=top width=83>
<P align=left><B>2007</B><B>营收</B></P></TD>
<TD vAlign=top width=130>
<P align=left><B>2007</B><B>市场份额</B><B> (%)</B></P></TD>
<TD vAlign=top width=83>
<P align=left><B>2006</B><B>营收</B></P></TD>
<TD vAlign=top width=109>
<P align=left><B>2006</B><B>市场份额</B></P></TD>
<TD vAlign=top width=116>
<P align=left><B>'06-'07</B><B>增长率</B><B>(%)</B></P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>Business Objects</P></TD>
<TD vAlign=top width=83>
<P align=left>939.6</P></TD>
<TD vAlign=top width=130>
<P align=left>18.2</P></TD>
<TD vAlign=top width=83>
<P align=left>870.6</P></TD>
<TD vAlign=top width=109>
<P align=left>19.0</P></TD>
<TD vAlign=top width=116>
<P align=left>7.9</P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>SAS Institute</P></TD>
<TD vAlign=top width=83>
<P align=left>752.3</P></TD>
<TD vAlign=top width=130>
<P align=left>14.5</P></TD>
<TD vAlign=top width=83>
<P align=left>665.8</P></TD>
<TD vAlign=top width=109>
<P align=left>14.4</P></TD>
<TD vAlign=top width=116>
<P align=left>13.0</P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>Cognos</P></TD>
<TD vAlign=top width=83>
<P align=left>710</P></TD>
<TD vAlign=top width=130>
<P align=left>13.7</P></TD>
<TD vAlign=top width=83>
<P align=left>621.5</P></TD>
<TD vAlign=top width=109>
<P align=left>13.6</P></TD>
<TD vAlign=top width=116>
<P align=left>14.2</P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>Microsoft</P></TD>
<TD vAlign=top width=83>
<P align=left>547</P></TD>
<TD vAlign=top width=130>
<P align=left>10.6</P></TD>
<TD vAlign=top width=83>
<P align=left>455.2</P></TD>
<TD vAlign=top width=109>
<P align=left>9.9</P></TD>
<TD vAlign=top width=116>
<P align=left>20.2</P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>Oracle</P></TD>
<TD vAlign=top width=83>
<P align=left>484.5</P></TD>
<TD vAlign=top width=130>
<P align=left>9.4</P></TD>
<TD vAlign=top width=83>
<P align=left>236.4</P></TD>
<TD vAlign=top width=109>
<P align=left>5.2</P></TD>
<TD vAlign=top width=116>
<P align=left>105</P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>SAP</P></TD>
<TD vAlign=top width=83>
<P align=left>408.5</P></TD>
<TD vAlign=top width=130>
<P align=left>7.9</P></TD>
<TD vAlign=top width=83>
<P align=left>306.5</P></TD>
<TD vAlign=top width=109>
<P align=left>6.7</P></TD>
<TD vAlign=top width=116>
<P align=left>33.3</P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>Others</P></TD>
<TD vAlign=top width=83>
<P align=left>1,332.6</P></TD>
<TD vAlign=top width=130>
<P align=left>25.8</P></TD>
<TD vAlign=top width=83>
<P align=left>1,420.4</P></TD>
<TD vAlign=top width=109>
<P align=left>31</P></TD>
<TD vAlign=top width=116>
<P align=left>-6.2</P></TD></TR>
<TR>
<TD vAlign=top width=99>
<P align=left>Total</P></TD>
<TD vAlign=top width=83>
<P align=left>5,141.7</P></TD>
<TD vAlign=top width=130>
<P align=left>100</P></TD>
<TD vAlign=top width=83>
<P align=left>4,576.3</P></TD>
<TD vAlign=top width=109>
<P align=left>100</P></TD>
<TD vAlign=top width=116>
<P align=left>13.1</P></TD></TR></TBODY></TABLE></P>
<P>数据来源: Gartner (May 2008)</P>]]></description>
</item><item>
<title><![CDATA[在外企工作，要知道的一些潜规则]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=37593</link>
<author>idmer</author>
<pubDate>2008/7/9 14:58:16</pubDate>
<description><![CDATA[
<P><FONT color=#0000ff><STRONG>IDMer：</STRONG>有意思的一篇文章，说的还是很形象的。</FONT></P>
<P>转自：<A href="http://sx4.i.auto.sohu.com/zt-869620.html#1"><FONT color=#000000 size=2>http://sx4.i.auto.sohu.com/zt-869620.html#1</FONT></A></P>
<P>老外的想法做法就是不一样，如果你想在外企工作得好，有些潜规则你最好心里有数。</P>
<P><STRONG>Unacceptable：<BR></STRONG>老外打小受的教育是人要以表扬鼓励为主，所以老外批评人比较含蓄。说你这件事办的unacceptable，已经算是说的很重了，中国老板在外企混久了， 也便跟着装起来，对你不满，写email给你，左一个unacceptable右一unacceptable。<BR>潜台词相当于：<FONT color=#ff0000>你这个SB，你奶奶个熊， 给老子小心点，等等。</FONT></P>
<P><STRONG>CC：</STRONG><BR>就是Copy。我看email，第一看标题，第二看CC给谁，第三才看内容。CC给谁基本上能够说明对方的态度，CC一大批老板的，肯定不是啥好事，对方要推卸责任。<BR>潜台词：<FONT color=#ff0000>我这件事告诉你了哦，和我没关系了，你自己看着办吧，反正老板都知道?都盯着你呢。 最开心的是看到自己的名字在CC那一栏里面，因为那意味着那就是这封信不用回，看看就可以。有人会回的。</FONT></P>
<P><STRONG>Concern：</STRONG><BR>中文翻译成"关注"，其实根本不是关注的意思，老外要是说他很concern， 那就是事情不妙，所谓老外打喷嚏，中国人集体感冒。<BR>潜台词：<FONT color=#ff0000>老子很不爽，这事儿怎么这么乱七八糟，给我注意点!</FONT></P>
<P><STRONG>Great：</STRONG><BR>刚才说了，老外打小受教育要多夸人，少批评人，所以老外一天到晚把"It"s great!"，"youdidagreatjob!"挂在嘴上，初听还飘飘然了几回，听久了，才知道其实压根儿就是他们口头禅，心里未必觉得你有多 great，同义词还有fantastic!wonderful!Gorgeous!Fabulous!等等。<BR>潜台词：<FONT color=#ff0000>还马马虎虎啦，一般般了，还过得去。</FONT></P>
<P><STRONG>F.Y.I：</STRONG><BR>以前一直以为是forward邮件的时候系统会自动加上这几个字，因为人家转过来的信上都有这三个字母，过了好久才知道是人家自己加的，意思是：For Your Information。看到这几个字母意味着下面内容和我有关，但是关系不大，看看就好。因为对方如果要你采取行动，一定会说清楚：Allen， please……。。而不会只是F.Y.I了事。<BR>潜台词：<FONT color=#ff0000>和你关系不大，给你随便看看。</FONT></P>
<P><STRONG>Issue：</STRONG><BR>中文翻译成事情，其实是贬义词，准确意思是"不好的事情"，老外说有一个issue，就是有件鸟事要处理。要有很多issue，那就是一团糟。<BR>潜台词：<FONT color=#ff0000>事情不妙，大家都赶快处理。</FONT></P>
<P><STRONG>Aggressive：</STRONG><BR>中文翻译成"进攻性的"，在外企里面意思含糊，褒义的有"具有开拓精神的"，"有事业心的"，贬义的有"咄咄逼人的"，"喜欢没头脑乱闯的"，"容易得罪别人的"，反正意思可褒可贬，看你自己琢磨。 面试时候说自己"aggressive"的，潜台词是：我可不是那种混日子的人，我是能干事的，招我准没错。 但是一但说别人"very aggressive"，基本上潜台词是说：<FONT color=#ff0000>这SB凶巴巴的，不好相处，做事没头没脑，老闯祸…不是啥好鸟。</FONT></P>
<P><STRONG>Involve：</STRONG><BR>中文翻译成"介入"，反正involve的老板越高层事情就越复杂，director要是involve了，manager就开始紧张，VP要是involve了，中国区相关人员都别想有好日子过，得加班加得四脚朝天。<BR>潜台词：<FONT color=#ff0000>大佬很生气，后果很严重。</FONT></P>
<P><STRONG>RESEND！</STRONG><BR>重传。 <BR>潜台词：<FONT color=#ff0000>有没在上班的呀？还没有答复过来？是不是在混水摸鱼？我的时间很宝贵的，不快点回复你就死定了。</FONT></P>
<P><STRONG>highlight ：<BR></STRONG>强调，意思是说你搞不定一定要提前highlight出来，抗不住就早点讲，一般要highlight的东西都是比较难搞定的。</P>
<P><STRONG>urgent ：</STRONG><BR>紧急的，遇到这样的urgent的case你就有得麻烦了，电话基本不会停下来，好一阵子的热线。</P>
<P><STRONG>appreciate ：</STRONG><BR>欣赏。当事情自己解决不了的时候，需要别人帮忙的时候，或者是自己做错事无法挽回的时候，一句yourkindhelpshouldbeappreciated。就会发挥很大的作用 了。</P>
<P><STRONG>guarantee ：<BR></STRONG>保证，之前promise的东西没有出现，于是再次向别人求助的时候，对方一句Are you guarantee of it?让你很是尴尬，使对方陷入困境。对于sales来讲，此词使用 的几率教高。</P>
<P><STRONG>myunderstandingis...</STRONG><BR>翻成中文是我的理解是。<BR>潜台词是：<FONT color=#ff0000>应该是。你的理解有误，我在此再给你解释一下。虽然看上 去是对方在说自己的理解，但基本上是认为你的看法是错的，他的是正确的。</FONT></P>
<P><STRONG>Im very disappointed...</STRONG><BR>中文是：我很失望。 <BR>潜台词是：<FONT color=#ff0000>你怎么搞得，弄成这样。后果有点严重，基本上这个人对你有了 一个很差的印象了。</FONT></P>]]></description>
</item><item>
<title><![CDATA[Google公司介绍 (PPT)]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=37280</link>
<author>idmer</author>
<pubDate>2008/6/30 23:33:01</pubDate>
<description><![CDATA[<P><IMG style="BORDER-LEFT-COLOR: #000000; BORDER-BOTTOM-COLOR: #000000; BORDER-TOP-COLOR: #000000; BORDER-RIGHT-COLOR: #000000" src="http://cdn.slideshare.net/google-inc-1201081238277052-2-thumbnail-2?1201081239" border=0><BR><BR>转自：<A href="http://www.slideshare.net/idak/google-inc/download">http://www.slideshare.net/idak/google-inc/download</A><BR><BR>介绍了Google的产品与发展、公司历史、竞争优势、关键技术等，还有一些照片。<A></A></P>]]></description>
</item><item>
<title><![CDATA[TRS启动中国首届文本挖掘智能大赛]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=37242</link>
<author>idmer</author>
<pubDate>2008/6/29 0:38:25</pubDate>
<description><![CDATA[<P>转自：<A href="http://www.trs.com.cn/news/gsxw/200806/t20080620_2241.html">http://www.trs.com.cn/news/gsxw/200806/t20080620_2241.html</A><BR><BR>
<TABLE class=kuang01 height="100%" cellSpacing=0 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD class=font14 vAlign=center scope=col align=middle colSpan=5 height=60>TRS启动中国首届文本挖掘智能大赛 探寻行业最佳实践</TD></TR>
<TR>
<TD vAlign=top align=middle colSpan=5 height=31>
<TABLE class=xian5 cellSpacing=0 cellPadding=0 width="98%" border=0>
<TBODY>
<TR>
<TD class=font12 vAlign=center scope=col align=middle height=28>2008-06-20 </TD></TR>
<TR>
<TD class=font02 vAlign=center scope=col align=middle height=25></TD></TR></TBODY></TABLE></TD></TR>
<TR>
<TD width="1%" height=100 rowSpan=4>&nbsp;</TD>
<TD vAlign=top align=left colSpan=2>
<P class=font12><SPAN class=font12 id=arctext>
<STYLE id=_Custom_Style_>
.h1 {
	FONT-WEIGHT: bold; TEXT-JUSTIFY: inter-ideograph; FONT-SIZE: 22pt; MARGIN: 17pt 0cm 16.5pt; LINE-HEIGHT: 240%; TEXT-ALIGN: justify
}
.h2 {
	FONT-WEIGHT: bold; TEXT-JUSTIFY: inter-ideograph; FONT-SIZE: 16pt; MARGIN: 13pt 0cm; LINE-HEIGHT: 173%; TEXT-ALIGN: justify
}
.h3 {
	FONT-WEIGHT: bold; TEXT-JUSTIFY: inter-ideograph; FONT-SIZE: 16pt; MARGIN: 13pt 0cm; LINE-HEIGHT: 173%; TEXT-ALIGN: justify
}
DIV.union {
	FONT-SIZE: 14px; LINE-HEIGHT: 18px
}
DIV.union TD {
	FONT-SIZE: 14px; LINE-HEIGHT: 18px
}

</STYLE>

<P style="MARGIN: 0px">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2008年6月20日，<STRONG><A href="http://www.trs.com.cn/" target=_self>北京拓尔思（TRS）信息技术股份有限公司</A></STRONG>携手<STRONG><A href="http://www.chinakdd.com/" target=_self>数据挖掘研究院（china KDD）</A></STRONG>共同举办的2008 TRS杯中国首届文本挖掘智能大赛正式启动。</P>
<P style="MARGIN: 0px"><BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 此项赛事的举办，旨在整体推动文本挖掘技术向前发展；提升数据挖掘、信息检索、自然语言处理等研究领域基础知识的综合应用能力；寻找、发现、选拔更多的高知识型专业文本挖掘技术人才；为文本挖掘技术更好的服务商业智能提供有力的后续保障。</P>
<P style="MARGIN: 0px"><BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; E信息时代，国内许多企业正处于内部信息和外部社会信息急剧增长的状况下，海量信息影响正确决策。文本挖掘技术的出现则让人们找到了应对“信息爆炸”的信心，它通过挖掘和分析，将如同散沙的信息整合成一盘全局，让人们以最便捷的方式从中提炼出最精华的知识和智能，以支持决策，从而将闲散的信息资源转换成财富。</P>
<P style="MARGIN: 0px"><BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 文本挖掘是一种智能化的工具，它在功能上超越了传统的信息检索软件，能够根据用户的真正需要，把与之相关联、有价值以及用户以前未曾注意的有用信息，都检索出来。文本挖掘技术是建立在对原始信息的分类和聚类基础上的新技术，虽然它在我国还只是处于初级阶段，但文本挖掘作为商业智能系统的重要组成部分，已经被金融、电信、保险、能源、零售等行业管理者所认识，并成为这些行业信息化建设中的重中之重。</P>
<P style="MARGIN: 0px"><BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; TRS作为国内最大的搜索和内容管理技术提供商，及作为国内第一家研发出真正实用化文本挖掘产品和具有丰富行业项目实施经验的软件企业，有责任为文本挖掘技术的进步，特别是中文文本挖掘技术的进步贡献力量。此次TRS与数据挖掘权威学术平台数据挖掘研究院的强强联手，就是希望能够让许许多多在文本挖掘领域有着先进理念，独到见解的人才与作品脱颖而出。</P>
<P style="MARGIN: 0px"><BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; TRS杯中国首届文本挖掘智能大赛已经开始了，无论你是对文本挖掘感兴趣的企业技术人员或决策人士、无论你是在文本挖掘技术领域研究颇深的专业人士，还是刚刚涉足文本挖掘技术领域的新手，都请关注我们。三人行必有我师，只有思想的碰撞才会产生出绚烂的火花。动动手指，进入TRS或数据挖掘研究院网站，也许就会得到你想要的。</P>
<P style="MARGIN: 0px">&nbsp;</P>
<P style="MARGIN: 0px">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <STRONG><A href="http://www.trs.com.cn/news/schd/2008wbwjds/index.html" target=_self>“2008 TRS杯中国首届文本挖掘智能大赛”现场 》》</A></STRONG><BR></P></SPAN></TD></TR></TBODY></TABLE></P>]]></description>
</item><item>
<title><![CDATA[可视化方法的元素周期表]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=idmer&amp;id=32328</link>
<author>idmer</author>
<pubDate>2008/3/10 23:34:42</pubDate>
<description><![CDATA[
<P>转自：<A href="http://www.visual-literacy.org/periodic_table/periodic_table.html"><FONT face=Verdana size=2>http://www.visual-literacy.org/periodic_table/periodic_table.html</FONT></A></P>
<P>在网上看到了整理的Ralph Lengler和Martin J.Eppler整理的这份“可视化方法的元素周期表”，挺有意思，可以让你一览可视化方法的全貌。当然它也不是尽善尽美，某些方法的归类值得商榷，不过总体上而言，值得参考。</P>
<P>为了方便使用，我把整个网页打包成一个.mht文件，大家可以下载到本地查看，鼠标移动到每个元素上时会显示相应的可视化图片。注意：使用IE打开时，需允许阻止的内容（脚本或ActiveX控件）。</P>
<P><STRONG>附件：<IMG src="images/file/zip.gif" border=0><A href="uploadfile/200831023436152.ZIP" target=_blank>A Periodic Table of Visualization Methods.zip</A></STRONG></P>
<P><IMG style="BORDER-LEFT-COLOR: #000000; BORDER-BOTTOM-COLOR: #000000; BORDER-TOP-COLOR: #000000; BORDER-RIGHT-COLOR: #000000" src="uploadfile/200831023453237.GIF" border=0 width=640></P>]]></description>
</item>
</channel>
</rss>