• <nav id="y4ec8"><tt id="y4ec8"></tt></nav>
  • 精通特征工程
    10推薦 收藏
    10.1K閱讀
    圖靈程序設計叢書

    精通特征工程

    愛麗絲·鄭 , 阿曼達·卡薩麗 (作者) 陳光欣 (譯者)
    上市銷售
    通過Python示例掌握特征工程基本原則和實際應用,增強機器學習算法效果
    本書介紹大量特征工程技術,闡明特征工程的基本原則。主要內容包括:機器學習流程中
    的基本概念,數值型數據的基礎特征工程,自然文本的特征工程,詞頻- 逆文檔頻率,高效的分類變量編碼技術,主成分分析,模型堆疊,圖像處理,等等。

    收藏本書能做什么?

    有情況的時候會收到通知,比如電子書發布等。

    PS:也會在圖靈社區電報頻道更新

    電子書
    ¥29.99
    格式
    mobi   pdf

    紙質書
    ¥48.38 ¥59.00

    出版信息

    • 書  名精通特征工程
    • 系列書名圖靈程序設計叢書
    • 執行編輯關于本書的內容有任何問題,請聯系 岳新欣
    • 出版日期2019-04-15
    • 書  號978-7-115-50968-0
    • 定  價59.00 元
    • 頁  數156
    • 印刷方式單色
    • 開  本16開
    • 出版狀態上市銷售
    • 原書名Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists
    • 原書號9781491953242

    所屬分類

    同系列書

    • HTTP權威指南

      David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陳涓   趙振平   譯

      本書是HTTP及其相關核心Web技術方面的權威著作,主要介紹了Web應用程序是如何工作的,核心的因特網協議如何...

    • JavaScript高級程序設計(第3版)

      Nicholas C.Zakas   李松峰   曹力   譯

      本書是JavaScript超級暢銷書的新版。ECMAScript 5 和HTML5在標準之爭中雙雙勝出,使大量...

    • 計算機科學的基礎

      Al Aho   Jeff Ullman   傅爾也   譯

      本書全面而詳細地闡述了計算機科學的理論基礎,從抽象概念的機械化到各種數據模型的建立,用算法、數據抽象等核心思想...

    • Java技術手冊(第6版)

      Benjamin J Evans   David Flanagan   安道   譯

      通過學習本書,你將能夠: 掌握最新的語言細節,包括Java 8的變化 使用基本的Java句法學習面向對...

    • 機器學習實戰

      Peter Harrington   李銳   李鵬   曲亞東   王斌   譯

      機器學習是人工智能研究領域中一個極其重要的研究方向,在現今的大數據時代背景下,捕獲數據并從中萃取有價值的信息或...

    本書特色

    特征工程是機器學習流程中至關重要的一個環節,然而專門討論這個話題的著作卻寥寥無幾。本書旨在填補這一空白,著重闡明特征工程的基本原則,介紹大量特征工程技術,教你從原始數據中提取出正確的特征并將其轉換為適合機器學習模型的格式,從而輕松構建模型,增強機器學習算法的效果。

    然而,本書并非單純地講述特征工程的基本原則,而是通過大量示例和練習將重點放在了實際應用上。每一章都集中研究一個數據問題:如何表示文本數據或圖像數據,如何為自動生成的特征降低維度,何時以及如何對特征進行標準化,等等。最后一章通過一個完整的例子演示了多種特征工程技術的實際應用。書中所有代碼示例均是用Python編寫的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。

    - 數值型數據的特征工程:過濾、分箱、縮放、對數變換和指數變換
    - 自然文本技術:詞袋、n元詞與短語檢測
    - 基于頻率的過濾和特征縮放
    - 分類變量編碼技術:特征散列化與分箱計數
    - 使用主成分分析的基于模型的特征工程
    - 模型堆疊與k-均值特征化
    - 圖像特征提取:人工提取與深度學習

    目錄

    版權聲明 閱讀
    O'Reilly Media, Inc. 介紹 閱讀
    前言 閱讀
    第 1 章 機器學習流程 閱讀
    第 2 章 簡單而又奇妙的數值
    第 3 章 文本數據:扁平化、過濾和分塊
    第 4 章 特征縮放的效果:從詞袋到 tf-idf
    第 5 章 分類變量:自動化時代的數據計數
    第 6 章  數據降維:使用 PCA 擠壓數據
    第 7 章 非線性特征化與 k-均值模型堆疊
    第 8 章 自動特征生成:圖像特征提取和深度學習
    第 9 章 回到特征:建立學術論文推薦器
    附錄 A 線性建模與線性代數基礎
    作者簡介 閱讀
    封面簡介 閱讀

    作者介紹

    愛麗絲·鄭(Alice Zheng) 亞馬遜廣告平臺建模和優化團隊負責人,應用機器學習、生成算法和平臺開發領域的技術領導者,前微軟研究院機器學習研究員。

    阿曼達·卡薩麗(Amanda Casari) 谷歌云開發者關系工程經理,曾是Concur Labs的產品經理和數據科學家,在數據科學、機器學習、復雜系統和機器人等多個領域都有豐富經驗。

    大家也喜歡

    • Feature Engineering一般應該翻譯為特征工程吧
      fantasma  發表于 2018-05-08 23:11:37
      推薦
    • 這本書啥時候能出來啊?有電子版不?
      郝林  發表于 2018-12-12 16:14:16
      推薦
    • 電子書啥時候出來
      機器小白  發表于 2019-03-20 11:04:33
      推薦
    • 這本書什么時候出來啊
      abing  發表于 2019-04-01 15:57:29
      推薦
      • 即將開始印刷,預計4月中旬會出版:)

        岳新欣  發表于 2019-04-01 17:34:33
    • 電子版購買之后就會發送嗎?
      美的熱水壺  發表于 2019-04-08 17:13:46
      推薦
      • 您好,電子書的相關說明請見http://www.fck8.com/article/497743

        岳新欣  發表于 2019-04-09 08:53:59
      • @岳新欣 同問,這本書的電子書購買了會發貨嗎?因為顯示“預售”,不知道購買了是否還是要跟紙質書一樣需要等? 您發送的這個鏈接中沒有針對該問題有用的信息

        kidzying  發表于 2019-04-09 18:32:32
      • @kidzying 直接可以下載pdf文件

        coderzc  發表于 2019-04-09 22:16:29
      • 購買之后就可以下載的。

        岳新欣  發表于 2019-04-10 09:01:10
    • 附帶的源代碼只有代碼文件,沒有對應的數據文件,導致代碼沒有辦法運行。這個問題如何解決。
      coderzc  發表于 2019-04-09 22:15:46
      推薦
      • “隨書下載”中新增了幾個數據集的下載鏈接,請看看能否解決您的問題。

        岳新欣  發表于 2019-04-10 08:57:35
      • @岳新欣 謝謝回復。不過有些鏈接的數據集對不上。在3.1.2節使用的數據集是challenge 6的,但是鏈接中只有challenge 13。

        coderzc  發表于 2019-04-10 11:55:11
      • 我也有同感,而且數據集找起來好麻煩,我都沒有找到。

        送你一匹馬  發表于 2019-07-05 21:17:14
      • @coderzc數據集的下載鏈接在哪里?我怎么一直沒找到呢?

        送你一匹馬  發表于 2019-07-05 21:24:09
    • 請問 第 9 章 回到特征:建立學術論文推薦器 中的數據集要在哪里找呢 隨書下載的文檔里也沒提
      Hendyzone  發表于 2019-04-15 17:33:45
      推薦
      • 請試試https://www.openacademic.ai/oag/

        岳新欣  發表于 2019-04-16 08:53:07
      • @岳新欣 找到了 感謝

        Hendyzone  發表于 2019-04-17 09:25:55
      • @Hendyzone 你好,請問你有數據集嗎?可以給我share一份嗎?非常感謝。沒有數據集代碼都跑不起來。

        送你一匹馬  發表于 2019-08-01 18:26:58
      • @送你一匹馬 就在上面的鏈接里的那個 mag_papers_0.zip

        Hendyzone  發表于 2019-08-08 20:05:38
    • 已購電子版,特征工程一起學習交流可加微信yulianghao809
      奔跑的海盜會笑  發表于 2019-04-22 16:19:34
      推薦
    • 第8頁 ——“在百萬歌曲數據集中,原始的收聽次數并不是衡量用戶喜好的強壯指標。”“強壯”不應該是魯棒嗎
      caroline_123  發表于 2019-05-03 19:29:31
      推薦
    • 本書應該配套數據集,而不是提供下載地址自行下載,因為下載的數據集很多不符合原代碼的要求
      ranranV  發表于 2019-05-19 15:19:33
      推薦
    • 很好的書,另外第六章標題多了一個空格,能否去除
      樊睡懶覺  發表于 2019-05-24 20:10:20
      推薦
    • 理解錯了標題,本來以為第8章講了圖像的前處理技術。結果講的是DNN各層對圖像的處理。。。
      vpoint  發表于 2019-06-21 16:22:48
      推薦
    • 可惜正文內容沒有預覽,不能先試讀一下看需不需要買。
      zwang  發表于 2019-06-28 11:06:02
      推薦
    新浪爱彩新浪爱彩平台新浪爱彩主页新浪爱彩网站新浪爱彩官网新浪爱彩娱乐新浪爱彩开户新浪爱彩注册新浪爱彩是真的吗新浪爱彩登入新浪爱彩快三新浪爱彩时时彩新浪爱彩手机app下载新浪爱彩开奖 阳江 | 文山 | 大丰 | 常州 | 大同 | 石狮 | 大庆 | 三河 | 温岭 | 衡阳 | 江苏苏州 | 东阳 | 馆陶 | 渭南 | 上饶 | 衡阳 | 遂宁 | 高雄 | 巢湖 | 保山 | 姜堰 | 涿州 | 宜昌 | 襄阳 | 喀什 | 琼海 | 宿迁 | 大庆 | 长垣 | 东方 | 株洲 | 屯昌 | 黄南 | 芜湖 | 巴彦淖尔市 | 钦州 | 海南 | 灌南 | 遂宁 | 商洛 | 雅安 | 海拉尔 | 博尔塔拉 | 邯郸 | 南安 | 新乡 | 自贡 | 溧阳 | 通辽 | 白沙 | 宁德 | 商丘 | 万宁 | 晋江 | 新疆乌鲁木齐 | 固原 | 昌吉 | 宜都 | 潍坊 | 景德镇 | 深圳 | 吉林长春 | 信阳 | 保定 | 石河子 | 西双版纳 | 达州 | 丹东 | 衡阳 | 朝阳 | 三沙 | 固原 | 延边 | 贵港 | 广西南宁 | 衡阳 | 广元 | 儋州 | 广饶 | 云南昆明 | 六安 | 崇左 | 醴陵 | 孝感 | 滨州 | 宜都 | 郴州 | 宣城 | 忻州 | 定西 | 黄南 | 金华 | 长葛 | 昭通 | 锡林郭勒 | 仁怀 | 吉林 | 内江 | 海西 | 仁怀 | 抚州 | 吉林长春 | 通辽 | 来宾 | 公主岭 | 楚雄 | 雅安 | 靖江 | 江门 | 巢湖 | 北海 | 威海 | 阳春 | 淮北 | 醴陵 | 平凉 | 鹤壁 | 常州 | 滕州 | 益阳 | 南安 | 瓦房店 | 黄石 | 阿里 | 通辽 | 灌云 | 兴化 | 巴彦淖尔市 | 乐山 | 单县 | 济南 | 嘉峪关 | 昌吉 | 肥城 | 石河子 | 莱州 | 海北 | 杞县 | 沛县 | 邯郸 | 阿拉善盟 | 晋中 | 阳春 | 三亚 | 嘉善 | 洛阳 | 广安 | 昌吉 | 株洲 | 馆陶 | 赵县 | 瓦房店 | 莱州 | 通辽 | 昌吉 | 延边 | 西藏拉萨 | 乌兰察布 | 惠州 | 广西南宁 | 溧阳 | 上饶 | 郴州 | 文山 | 余姚 | 台山 | 宁德 | 河池 | 金华 | 辽源 | 新沂 | 通辽 | 基隆 | 东阳 | 黔东南 | 阿拉尔 | 株洲 | 大同 | 黄石 | 铜仁 | 汕尾 | 潮州 | 包头 | 慈溪 | 巢湖 | 珠海 | 吴忠 | 包头 | 牡丹江 | 博罗 | 泉州 | 东方 | 巴音郭楞 | 清徐 | 四川成都 | 襄阳 | 德阳 | 百色 | 巴彦淖尔市 | 湛江 | 泗洪 | 吉林 | 青海西宁 | 佛山 | 遵义 | 辽宁沈阳 | 图木舒克 |