当前位置:首页>正文

集体智慧编程【正版图书 无忧售后】 pdf 115盘 kindle 下载 tct lit mobi 在线

免费下载书籍地址:PDF下载地址

精美图片

集体智慧编程【正版图书 无忧售后】书籍详细信息

  • ISBN:9787121254437
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2015-03
  • 页数:356
  • 价格:12.67
  • 纸张:胶版纸
  • 装帧:平装
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分

寄语:

【正版书籍 闪电发货 品质无忧 可开发票】

内容简介:

《集体智慧编程》以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。《集体智慧编程》内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。

《集体智慧编程》是Web开发者、架构师、应用工程师等的优佳选择。

书籍目录:

TableofContents前言?viii第1章集体智慧导言?1什么是集体智慧?2什么是机器学习?3机器学习的局限?4真实生活中的例子?5学习型算法的其他用途?5第2章提供推荐?7协作型过滤?7搜集偏好?8寻找相近的用户?9推荐物品?15匹配商品?17构建一个基于del.icio.us的链接推荐系统?19基于物品的过滤?22使用MovieLens数据集?25基于用户进行过滤还是基于物品进行过滤?27练习?28第3章发现群组?29监督学习和无监督学习?29单词向量?30分级聚类?33绘制树状图?38列聚类?40K-均值聚类?42针对偏好的聚类?44以二维形式展现数据?49有关聚类的其他事宜?53练习?53第4章搜索与排名?54搜索引擎的组成?54一个简单的爬虫程序?56建立索引?58查询?63基于内容的排名?64利用外部回指链接?69从点击行为中学习?74练习?84第5章优化?86组团旅游?87描述题解?88成本函数?89随机搜索?91爬山法?92模拟退火算法?95遗传算法?97真实的航班搜索?101涉及偏好的优化?106网络可视化?110其他可能的应用场合?115练习?116第6章文档过滤?117过滤垃圾信息?117文档和单词?118对分类器进行训练?119计算概率?121朴素分类器?123费舍尔方法?127将经过训练的分类器持久化?132过滤博客订阅源?134对特征检测的改进?136使用Akismet?138替代方法?139练习?140第7章决策树建模?142预测注册用户?142引入决策树?144对树进行训练?145选择最合适的拆分方案?147以递归方式构造树?149决策树的显示?151对新的观测数据进行分类?153决策树的剪枝?154处理缺失数据?156处理数值型结果?158对住房价格进行建模?158对“热度”评价进行建模?161什么时候使用决策树?164练习?165第8章构建价格模型?167构造一个样本数据集?167k-最近邻算法?169为近邻分配权重?172交叉验证?176不同类型的变量?178对缩放结果进行优化?181不对称分布?183使用真实数据——eBayAPI?189何时使用k-最近邻算法?195练习?196第9章高阶分类:核方法与SVM?197婚介数据集?197数据中的难点?199基本的线性分类?202分类特征?205对数据进行缩放处理?209理解核方法?211支持向量机?215使用LIBSVM?217基于Facebook的匹配?219练习?225第10章寻找独立特征?226搜集一组新闻?227先前的方法?231非负矩阵因式分解?232结果呈现?240利用股票市场的数据?243练习?248第11章智能进化?250什么是遗传编程?250将程序以树形方式表示?253构造初始种群?257测试题解?259对程序进行变异?260交叉?263构筑环境?265一个简单的游戏?268更多可能性?273练习?276第12章算法总结?277贝叶斯分类器?277决策树分类器?281神经网络?285支持向量机?289k-最近邻?293聚类?296多维缩放?300非负矩阵因式分解?302优化?304附录A:第三方函数库?309附录B:数学公式?316索引?323

作者介绍:

莫映,现供职于IBM中国开发实验室,在软件开发与设计领域里混迹已然10年有余,目前从事商业领域社交软件产品的研发工作。一直关注社交网络以及社交技术在不同领域里的运用,同时也积极活跃于公司内外的各种技术社区之中。

出版社信息:

暂无出版社相关信息,正在全力查找中!

书籍摘录:

暂无相关书籍摘录,正在全力查找中!

在线阅读/听书/购买/PDF下载地址:

在线阅读地址:集体智慧编程【正版图书 无忧售后】在线阅读

在线听书地址:集体智慧编程【正版图书 无忧售后】在线收听

在线购买地址:集体智慧编程【正版图书 无忧售后】在线购买

原文赏析:

Next, get a list of random people to make up the dataset. Fortunately, Hot or Not provides an API call that returns a list of people with specified criteria. In this exam-

ple, the only criteria will be that the people have “meet me” profiles, since only from

these profiles can you get other information like location and interests. Add this

function to hotornot.py:


What Does This Have to Do with the Articles Matrix?

So far, what you have is a matrix of articles with word counts. The goal is to factorize

this matrix, which means finding two smaller matrices that can be multiplied

together to reconstruct this one. The two smaller matrices are:

The features matrix

This matrix has a row for each feature and a column for each word. The values

indicate how important a word is to a feature. Each feature should represent a

theme that emerged from a set of articles, so you might expect an article about a

new TV show to have a high weight for the word “television.”

The weights matrix

This matrix maps the features to the articles matrix. Each row is an article and

each column is a feature. The values state how much each feature applies to each

articl...


Another feature that applies more evenly to a couple of companies is this one:

Feature 2

(46151801.813632453, 'GOOG')

(24298994.720555616, 'YHOO')

(10606419.91092159, 'PG')

(7711296.6887903402, 'CVX')

(4711899.0067871698, 'BIIB')

(4423180.7694432881, 'XOM')

(3430492.5096612777, 'DNA')

(2882726.8877627672, 'EXPE')

(2232928.7181202639, 'CL')

(2043732.4392455407, 'AVP')

(1934010.2697886101, 'BP')

(1801256.8664912341, 'AMGN')

[(2.9757765047938824, '20-Jan-06'),

(2.8627791325829448, '28-Feb-06'),

(2.356157903021133, '31-Mar-06'),

This feature represents large spikes in Google’s trading volume, which in the top

three cases were due to news events. The strongest day, January 20th, was the day

that Google announced it would not give information about its search engine usage

to the government. ...


Because new connections are only created when necessary, this method has to return a default value if there are no connections. For links from words to the hidden layer, the default value will be –0.2 so that, by default, extra words will have a slightly negative effect on the activation level of a hidden node. For links from the hidden layer to URLs, the method will return a default value of 0.


Pearson Correlation Score

A slightly more sophisticated way to determine the similarity between people’s inter-

ests is to use a Pearson correlation coefficient. The correlation coefficient is a mea-

sure of how well two sets of data fit on a straight line. The formula for this is more

complicated than the Euclidean distance score, but it tends to give better results in

situations where the data isn’t well normalized—for example, if critics’ movie rank-

ings are routinely more harsh than average.


Simulated annealing is an optimization method inspired by physics. Annealing is the

process of heating up an alloy and then cooling it down slowly. Because the atoms

are first made to jump around a lot and then gradually settle into a low energy state,

the atoms can find a low energy configuration.

其它内容:

书籍介绍

本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析 Web 上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从 Web 网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。

全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank 算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。

本书是 Web 开发者、架构师、应用工程师等的绝佳选择。

书籍真实打分

故事情节:7分

人物塑造:5分

主题深度:8分

文字风格:9分

语言运用:6分

文笔流畅:3分

思想传递:3分

知识深度:4分

知识广度:5分

实用性:6分

章节划分:7分

结构布局:5分

新颖与独特:5分

情感共鸣:6分

引人入胜:7分

现实相关:6分

沉浸感:8分

事实准确性:9分

文化贡献:3分

网站评分

书籍多样性:8分

书籍信息完全性:8分

网站更新速度:6分

使用便利性:5分

书籍清晰度:8分

书籍格式兼容性:4分

是否包含广告:9分

加载速度:7分

安全性:8分

稳定性:8分

搜索功能:9分

下载便捷性:4分

下载点评

  • 少量广告(297+)
  • 四星好评(646+)
  • 章节完整(123+)
  • 还行吧(261+)
  • 中评多(511+)
  • 愉快的找书体验(669+)
  • 内容齐全(146+)

下载评价

网友 冯***卉:听说内置一千多万的书籍,不知道真假的

网友 国***芳:五星好评

网友 师***怡:说的好不如用的好,真心很好。越来越完美

网友 蓬***之:好棒good

网友 国***舒:中评,付点钱这里能找到就找到了,找不到别的地方也不一定能找到

网友 方***旋:真的很好,里面很多小说都能搜到,但就是收费的太多了

网友 通***蕊:五颗星、五颗星,大赞还觉得不错!~~

网友 曹***雯:为什么许多书都找不到?

网友 印***文:我很喜欢这种风格样式。

网友 步***青:。。。。。好

网友 寿***芳:可以在线转化哦

网友 饶***丽:下载方式特简单,一直点就好了。

网友 林***艳:很好,能找到很多平常找不到的书。

版权声明

1本文:集体智慧编程【正版图书 无忧售后】转载请注明出处。
2本站内容除签约编辑原创以外,部分来源网络由互联网用户自发投稿仅供学习参考。
3文章观点仅代表原作者本人不代表本站立场,并不完全代表本站赞同其观点和对其真实性负责。
4文章版权归原作者所有,部分转载文章仅为传播更多信息服务用户,如信息标记有误请联系管理员。
5本站一律禁止以任何方式发布或转载任何违法违规的相关信息,如发现本站上有涉嫌侵权/违规及任何不妥的内容,请第一时间联系我们申诉反馈,经核实立即修正或删除。


本站仅提供信息存储空间服务,部分内容不拥有所有权,不承担相关法律责任。

相关文章:

  • Calculus Essentials for Dummies pdf 115盘 kindle 下载 tct lit mobi 在线
  • 妈妈宝宝0-4岁2013.01 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 国际贸易实务 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 黏土炼金术 黏土手办制作教程 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 犬夜叉 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 人的意识(原著第三版)(万千心理) pdf 115盘 kindle 下载 tct lit mobi 在线
  • Pro/E Wildfire 5.0中文版完全自学一本通(含DVD光盘1张) pdf 115盘 kindle 下载 tct lit mobi 在线
  • 语文 六年级上(RJ版 全彩版大字版 漫画图解 含教材习题答案)/小学学霸速记 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 带你去看音乐剧 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 制药设备与工程设计 pdf 115盘 kindle 下载 tct lit mobi 在线