最近幾年,耳熟能詳的”BAT”都在大談基礎設施轉型,例如百度的 Apollo 自動駕駛平臺,例如提供計算和數據處理能力的阿里云,例如定位為合作伙伴提供連接一切能力的微信。但當看似“BAT”的體量與技術能力達到了中國互聯網的上限時,后起之秀如”TMD”(今日頭條、美團、滴滴)以各自深耕多年的技術底蘊和業務體系也成了世界一方巨擘。
毫無疑問,中國互聯網企業技術水平與硅谷的整體差距越來越小,某些方面甚至有趕超之處。但在大數據&人工智能風口下,無論國內還是國外,都可以看出大企業的技術實踐難度都在擴大,于是乎大量重復的失敗和教訓默默隱藏在各企業內,國內外成功的經驗難以傳播、借鑒和參考。
在這背景下,ArchSummit 全球架構師峰會將于7月6-9日深圳舉行,已邀請了國內外知名企業的技術專家前來分享其核心架構實踐經驗,其中第一天日程如下:
點擊上方圖片或點擊此處了解ArchSummit深圳站大會日程
以下簡單介紹部分分享內容,相信屆時與國內外上百技術專家、千名技術同行交流的你,肯定會有獨到的體會和思考,感興趣的同學可以使用”dongfang”優惠碼8折報名(僅限10位,截至6月17日)!點擊此處可以立即報名!
劉磊,機器學習專家,在 ArchSummit 深圳站上將有兩場分享,內容詳見大會日程。
長期帶領團隊從事AI、機器學習的研發和軟件架構。在研和已完成項目包括:數據管理中機器學習核心技術、大規模數據分類、推薦系統、社會網絡挖掘、網絡僵尸病毒檢測、可穿戴數據挖掘、基于傳感器數據的個性化健康、基于大數據的教育系統。
研究成果獲得或已提交美國專利40多項,發表論文30余篇。
隨著手機、智能手表和生物傳感器等便攜式設備的普及,數字化自跟蹤技術近幾年已獲得長足發展。同樣,用于監測、存儲和分析人類自跟蹤數據的信息管理系統設計也在不斷的優化。
和以往任何時候相比,由于技術的快速發展,使得收集生物數據和生理數據這個過程變得越來越容易,例如心電圖(ECG)、血氧飽和度(SpQ2)、心率(HR)、腦電波信號(EEG)、皮膚電反應(GSR)、血壓、含氧量、體溫等等。這些自跟蹤數據可以幫助我們通過監測和分析,來更好理解個體的健康狀況。正因為此,挖掘傳感數據中的隱含價值受到越來越多工業和學術界的關注。
本次分享聚焦在介紹機器學習平臺在傳感數據中的應用,對利用多源傳感器數據結合機器學習技術來檢測人體行為項目做詳細介紹。
1.機器學習在多源傳感數據上應用的背景介紹
2.機器學習平臺和架構
1.系統架構&預處理和特征工程
2.建模和離線性能評估&在線部署、評估和模型更新
3.挑戰和項目收獲
1. 稀疏數據與數據缺失問題
2. 數據分布不均衡問題
3. 時序行為模式分析
4.總結和應用挑戰
1.警察局自動監測系統里的連續行為識別
2.老年人緊急狀況監測,預警系統
Dekun Zou,Google研究院資深研發工程師,負責深度學習的研發并產品化,在 ArchSummit 深圳站上將有兩場分享,內容詳見大會日程。
負責研發多個基于深度神經網絡的推薦系統,包括Android應用商店、Google廣告排名。加入Google研究院之前曾就職于Apple,再之前供職于亞馬遜云計算(AWS)。
具有10多年研究經驗,涉獵機器學習、計算機視覺、視頻以及圖像處理諸多領域。在國際雜志和會議上發表了20多篇論文,也是20多項美國專利的主要發明人。
隨著電子商務和在線服務越來越普及,海量在線資源很多時候多到讓用戶無從選擇,因此推薦系統的質量變得至關重要。
傳統的線性回歸方法在很多系統里應用廣泛,只不過,隨著深度神經網絡在圖像視覺領域的突破,很多研究人員開始利用神經網絡搭建深度推薦系統,推薦質量顯著超越傳統基于線性回歸系統,同時也簡化了以往搭建推薦系統所需專家知識(domain knowledge)。
深度推薦系統被廣泛應用于Google多項面向用戶的產品,一次又一次的突破質量瓶頸。此次演講會由淺入深探討如何構建基于深度學習的推薦系統,并討論最新的技術發展。
1.傳統線性回歸方法&深度學習優勢
2.信號類別
1.場景信號:當前場景相關的信息
2.用戶信號:用戶特征,用戶歷史信息,
3.物件信號:排序模型物件的特征
3.兩步定制化推薦
1. 深度挖掘,生成候選人列表
2. 混合人工生成的候選人,最終排序
4.模型訓練模式
1. 離線,根據系統日志 (適用于大系統,海量用戶)
2. 在線,強化學習(小量用戶,快速迭代)
5.user vector, item vector (swivel model)
1. 預生成的用戶向量降低推斷延時
2. 超大規模物件向量的學習(稀疏問題)
6.損失函數的構造
徐斌,在Facebook帶領Business Integrity的機器學習團隊和機器平臺架構團隊,在ArchSummit 深圳站上將有一場分享和一場深度培訓,內容詳見大會日程。
主要任務是確保Facebook的用戶和Facebook上所有商業業務之間的誠信溝通。這些商業業務存在于廣告、市場、社團/群組、粉絲專頁等等。
在進入Facebook前,在Microsoft擔任首席機器學習工程經理,帶領技術團隊開發云安全解決方案,實現對異常現象的檢測,并保護客戶在云中的身份、數據和應用的安全。再此前在Amazon工作10年,率領多個應用科學家團隊處理交易風險管理工作。
隨著電子商務崛起、云計算爆發,社交網絡大面積普及化,商業業務創新和開展越來越容易,我們能輕而易舉使用大規模資源和服務,全球化信息互動和共享已經可以同步。
但信息安全和商業誠信問題卻不斷增加,面對每天超過PB級的不平衡和模糊大數據,實時機器學習和解決方案面臨著巨大的挑戰。這樣的要求在各個領域越來越多,促發了許多突破性的研究成果和應用。
本次分享會快速瀏覽一些安全問題,然后講述一下機器學習平臺,重點講解能夠處理當下棘手問題的相關先進技術和解決方案以及真實的應用效果。最后會分享幾個最近機器學習在安全應用上的特別案例。
1.交易欺詐濫用、云計算安全以及其他商業誠信問題
2.機器學習平臺和架構
1. 離線構建,在線部署,反饋機制
2. 數據和特征工程
3. 平行 v.s 垂直模型結構
4. 傳統分類 v.s 深度學習
3.挑戰和切身教訓
1. 非平衡數據
2. 處理模糊性:半標簽和無標簽
3. 冷啟動問題
4.應用 1: 機器學習在交易風險管理方面的實踐
5.應用 2: 機器學習在云安全方面的實踐
Yunong 目前是 Netflix 的首席軟件工程師,帶領 Netflix API 平臺設計和架構團隊。在此前任職于 AWS 和 Joyent,主要方向是分布式系統,并幫助規劃和構建了多款云計算產品,例如 AWS IAM 和 Manta。與此同時,他也在維護開源項目 Node.JS 框架的校正。
FaaS 變革像風暴一般拓展到全球。事實上,因為企業都喜歡 FaaS 所帶來的 No-Ops,或者說在工程效率上的突出表現,FaaS 帶來的變革可以在一線開發者領域迅速擴展,能夠幫助工程師們更快速地將代碼部署到產品上。
在 Netflix,這些功能特性對于 Netflix API 平臺來說簡直是完美符合,工程師們用 JavaScript 來寫代碼并部署到 tier-1服務層,整個過程不是完全必須要去管理基礎架構設施或者運維。
然而,還是有很多權衡之處需要考慮,傳統的 FaaS 理念或者做法在今天看來,更適合那些對延遲要求不高的任務。但是,對于延遲很敏感,對可靠性以及可彈性擴展要求較高的任務來說,FaaS 還需要再優化。
通過本次分享,你將了解到 Netflix FaaS 平臺的架構和內部構成。
文杰,微信技術架構部專家工程師。2005年入職騰訊,曾參與主導搜索引擎,分布式存儲,分布式計算等多個項目的整體架構。2013年加入微信,現任技術架構部下大數據平臺團隊負責人,主導微信兩項基礎平臺:微信資源調度Yard平臺和微信流量實驗X平臺的研發。
微信每天承載數百億條的消息收發,支撐著微信功能的后臺服務也多達數萬個,如何確保這些在線服務的穩定可用和可控,是資源管理系統面臨的一大挑戰。
與此同時,AI技術方興未艾,圍繞著微信所開展的機器學習與數據挖掘的離線作業也日漸增多,對內部計算、存儲、網絡等資源提出了大量的需求,如何充分利用好服務器資源,高效調度各類計算作業,合理編排不同維度的資源組合也是資源調度系統的一個重要目標。
本主題闡述了微信的資源調度系統Yard如何利用容器技術解決在線服務與離線作業混合運行的各種問題挑戰,分享微信后臺在資源隔離、作業調度、容災設計等方面的成功實踐和思考。
1.微信后臺資源管理發展歷程
2.在線服務和離線作業的資源搶奪戰
3.微信資源調度系統Yard
1. 系統架構
2. 資源隔離的“舍”與“得”
3. 調度的AI
4. 網紅Docker在Yard中的應用
5. 踩過的“坑”與“坑”外的思考
4.成果展示&未來展望
張開翔,FISCO BCOS平臺架構師。在ArchSummit 深圳站上將有一場分享和一場深度培訓,內容詳見大會日程。
曾在騰訊工作多年,在分布式系統,網絡安全,海量服務等技術領域有豐富的經驗。目前致力于區塊鏈平臺系統建設、以及推動基于區塊鏈的業務落地。
分布式商業以多方參與、智能協同、專業分工、價值分享等為主要特征,典型的應用場景有銀證信保的多方產品合作、N+N供應鏈金融、分布式能源、分布式電商以及各類共享經濟等。
隨著分布式商業興起,以區塊鏈為代表的分布式賬本技術價值逐漸凸顯。具備“構建信任”能力的區塊鏈技術,不僅可用于公有鏈,也能在聯盟鏈中發揮巨大的效能。
在高安全、高性能、合法合規的金融場景里,對區塊鏈技術的研究和創新業務模式的開展,會遇到大量的挑戰,這次演講會深入剖析區塊鏈的底層技術和架構優化之道,分享業務落地的探索歷程,以及開源社區運營的經驗。通過技術和業務的努力,直面挑戰,把區塊鏈真正的使用到金融業務中。
1.展望業界,介紹區塊鏈技術和架構發展概況
2.從密碼學、數據、網絡共識等方面解析區塊鏈底層技術
3.分析區塊鏈技術在性能、安全、隱私、應用落地等方面面臨的挑戰和解決之道
1. 直面分布式系統不可能三角,在保證一致性、事務性、穩定性的前提下,突破瓶頸,提升系統性能
2. 建設立體安全體系,從通信、存儲、權限等多方面保障系統安全
3. 平衡公開透明和隱私保護的訴求,通過架構優化、密碼學、合作模式選擇等多種形式保護商業隱私
4. 從底層擴展區塊鏈協議和功能,為業務開發和運營提供便利
4.分享FISCO BCOS的平臺建設,以及兩個具體落地案例分享
在門店的商品、交易、會員、客流數字化過程中,雖然背靠成熟的、已有的電商系產品技術方案,但現實仍然很殘酷。目前商家面臨的主要痛點是:有門店缺客流,有粉絲無轉化,有會員難互動。面對這些困難,天貓提出面向全域消費者運營的”智慧門店”解決方法。
如何從千人一策,實現精準營銷?如何從在店成交,實現離店銷售?如何從私人關系,實現組織連接?面對復雜的線下網絡環境,天貓如何消滅那不到百分之一的投訴?
在經歷了2017年雙十一,2018年618等幾次考驗后,天貓也逐漸摸索出了一條實踐之路,和寶貴經驗。
1.背景、命題、方案
2.門店數字化:消費者體驗升級
1. 在線下單,門店履約
2. 到店購物,全域互動
3.門店數字化:商家賦能
1. 消費者沉淀,運營
2. 交易轉化,數據沉淀
4.面臨的挑戰
1. 紅包不好發,弱網檢測與飛行模式
2. 數據說清楚,面向組織架構的統計
3. 保障生命線,微服務的穩定性優化
5.小步快跑,敏捷的背后
不四,網名死馬,現就職于螞蟻金服體驗技術部,專注在 Node.js 領域 6 年,搭建了阿里巴巴和螞蟻金服內部 Node.js 模塊管理系統、中間件服務等基礎設施,負責內部 Node.js Web 框架的研發和開源。同時也是開源愛好者,Node.js Web 框架 Koa.js 和 Egg.js 的核心開發者,cnpm 中國鏡像維護者。
Node.js在Web應用中扮演越來越重要的角色,框架是其中的重中之重(要解決規范、效率、性能、安全等等問題)。Egg.js(開源) 是阿里和螞蟻聯合研發的企業級 Node.js Web 框架,不僅讓使用者可以更輕松的使用 Node.js 進行 Web 研發,同時也支持讓團隊架構師基于 Egg.js 打造更適合團隊的框架。
這次演講將會介紹基于螞蟻是怎樣在 Egg.js 之上搭建貼合自身業務形態的研發模式以及在這個過程中的實戰經驗。
1.使用 Node.js 進行企業級 Web 研發會遇到的問題
2.Egg.js 是什么,我們如何使用它來構建 Web 應用
3.螞蟻在使用 Node.js 實踐前后端分層架構中的經驗分享
? 前Tesla視覺深度學習負責人:自動駕駛的計算機視覺技術
目前 ArchSummit 限時9折報名,使用”dongfang”優惠碼可8折優惠!點擊此處可以立即報名!
PS:如需幫助可隨時聯系小助手豆包,致電:17326843116?(微信同號)