宋一民:守護(hù)“數(shù)據(jù)池塘”的新創(chuàng)客
2021-06-01 11:29 來源:法人雜志 作者:

  ◎ 文 《法人》全媒體記者 李遼 彭飛

  格子襯衫、框架眼鏡、牛仔褲、運(yùn)動(dòng)鞋,一眼便可識(shí)別的程序員打扮,談到計(jì)算機(jī)與網(wǎng)絡(luò),眼神活泛,滔滔不絕……宋一民身上涌動(dòng)著扎克伯格般“極客”的神采。但身為年輕一代的創(chuàng)業(yè)家,在他這份清秀和干凈的少年感之下,卻又蘊(yùn)藏著一種溫文爾雅、張弛有度的穩(wěn)重。

  2019年初春,決意作別美國的親友回國創(chuàng)業(yè)時(shí),宋一民正在美國Facebook從事隱私工程相關(guān)工作。這樣的決定意味著,他要與高額的年薪、前沿的科技環(huán)境、逐年增長(zhǎng)的股權(quán)激勵(lì)作出割舍。對(duì)于剛剛33歲的宋一民而言,作出這一決定“其實(shí)并不糾結(jié),也不痛苦”。想出來創(chuàng)業(yè)的想法由來已久,而多方安全計(jì)算理論上的突破使其在工業(yè)界落地成為了可能,加之全球?qū)﹄[私合規(guī)的重視加劇以及對(duì)數(shù)據(jù)流通價(jià)值的理解加深,宋一民覺得,時(shí)機(jī)到了。

  他的合伙人、同為Facebook員工的蔡超超似乎“代價(jià)”更大。彼時(shí)蔡超超剛剛獲得公司百萬美金級(jí)的最高獎(jiǎng)金,且剛剛升職。盡管在蔡超超看來,宋一民的這個(gè)決定相當(dāng)大膽,但他仍然愿意一同回國創(chuàng)業(yè)。

  宋一民與蔡超超決意要做的隱私計(jì)算技術(shù)方向,之前曾在2017年年初由宋一民在Facebook廣告部門提起,并做了一些嘗試。這項(xiàng)技術(shù)旨在實(shí)現(xiàn)“數(shù)據(jù)可用而不可見”的愿景,宋一民在國內(nèi)做過調(diào)研,當(dāng)時(shí)尚無這樣的技術(shù)落地,他預(yù)見這項(xiàng)技術(shù)必將能填補(bǔ)國內(nèi)該領(lǐng)域的空白,“簡(jiǎn)單來講,有多個(gè)相互獨(dú)立的數(shù)據(jù)池塘,在確保不讓魚出池塘的情況下,通過這項(xiàng)技術(shù),精確了解到關(guān)于魚的各項(xiàng)匯總數(shù)據(jù)。在過去,可能需要把各個(gè)池塘的魚混在一起,才能精確計(jì)算出這些數(shù)據(jù),但這樣做不僅池塘主不愿意,監(jiān)管也不允許?!?/p>

  2019年8月,數(shù)牘科技正式在北京創(chuàng)立,宋一民任CEO,蔡超超任CTO。公司拿到了國內(nèi)頂級(jí)投資機(jī)構(gòu)的數(shù)千萬元投資。憑借著隱私計(jì)算領(lǐng)域的技術(shù)優(yōu)勢(shì),短短不足兩年時(shí)間,數(shù)牘科技迅速與中國聯(lián)通、多個(gè)國有銀行等達(dá)成戰(zhàn)略合作,業(yè)務(wù)量逐漸攀升。

  近期,成立不足兩年時(shí)間的數(shù)牘科技即將迎來新一輪融資,宋一民透露,這一輪的估值已經(jīng)超過1億美金。

  隱私保護(hù)危機(jī)引發(fā)的決定

  在數(shù)牘科技的大開間辦公室中,宋一民的工位在進(jìn)門第一排的靠邊位置,在整個(gè)團(tuán)隊(duì)中并不顯眼。

  創(chuàng)業(yè)之前,北京人宋一民的生活似乎“波瀾不驚”,初高中就讀的北京八中,以寬松的教學(xué)環(huán)境在國內(nèi)教育圈聞名。去南京郵電大學(xué)讀計(jì)算機(jī)專業(yè)之前,他的生活圈幾乎沒出過北京市西城區(qū)。大學(xué)畢業(yè)后,他去了美國得克薩斯繼續(xù)攻讀計(jì)算機(jī)專業(yè)研究生。當(dāng)時(shí)金融危機(jī)剛結(jié)束,就業(yè)形勢(shì)嚴(yán)峻,與繼續(xù)深造相比,很多畢業(yè)生會(huì)優(yōu)先選擇工作,宋一民因科研能力突出畢業(yè)后被微軟錄取,之后又在激烈的競(jìng)爭(zhēng)中脫穎而出,來到了Facebook。

  在美國,計(jì)算機(jī)專業(yè)的學(xué)生畢業(yè)后被微軟、Facebook這樣的互聯(lián)網(wǎng)企業(yè)核心業(yè)務(wù)部門選中,基本意味著生活無憂。但宋一民一直有自己出來創(chuàng)業(yè)的想法,且一直在等待機(jī)會(huì),“我做決策時(shí)非常謹(jǐn)慎,回國創(chuàng)辦數(shù)牘科技已經(jīng)是我人生中做的最大決定了?!?/p>

  在2016年,在Facebook廣告的用戶數(shù)據(jù)部門工作的宋一民開始負(fù)責(zé)一些對(duì)外數(shù)據(jù)合作項(xiàng)目,他所在的部門要與各類數(shù)據(jù)提供者展開密切合作,但同時(shí)又要確保數(shù)據(jù)不被泄露。美國對(duì)侵犯用戶隱私的行為懲罰非常重,該部門在處理數(shù)據(jù)業(yè)務(wù)時(shí)都高度謹(jǐn)慎。2017年開始,作為技術(shù)主管,他負(fù)責(zé)過Instagram和Universal Ads等大型廣告服務(wù)項(xiàng)目的開展,還從0 到1主導(dǎo)了Facebook和500強(qiáng)企業(yè)的基于隱私保護(hù)的數(shù)據(jù)協(xié)作項(xiàng)目。

  隱私計(jì)算,其實(shí)是多種技術(shù)的組合,其中包含安全多方計(jì)算、聯(lián)邦學(xué)習(xí)和差分隱私等,它的目標(biāo)是在保護(hù)數(shù)據(jù)安全和用戶隱私的前提下,為不同機(jī)構(gòu)提供多方數(shù)據(jù)的分布式數(shù)據(jù)融合、聯(lián)合建模和數(shù)據(jù)使用。近些年,數(shù)據(jù)信息安全事件頻發(fā),隱私保護(hù)和數(shù)據(jù)流動(dòng)之間的矛盾日益凸顯,隱私計(jì)算或?qū)⒊蔀榻鉀Q這一矛盾的絕佳途徑。

  在幫助Facebook解決廣告業(yè)務(wù)中的用戶隱私保護(hù)問題時(shí),宋一民時(shí)常拉著蔡超超一起頭腦風(fēng)暴,“隱私計(jì)算本質(zhì)上是要打破數(shù)據(jù)綁架,與Facebook的占據(jù)流量入口和成為數(shù)據(jù)匯聚點(diǎn)的戰(zhàn)略是相左的,在Facebook內(nèi)部推這個(gè)項(xiàng)目很有阻力。所以,這個(gè)技術(shù)特別適合成立一個(gè)獨(dú)立的第三方公司來做。”

  蔡超超在Facebook作為技術(shù)領(lǐng)軍人物主導(dǎo)了多個(gè)項(xiàng)目,獲得了Facebook授予的Distinguished Equity(卓越獎(jiǎng)),在機(jī)器學(xué)習(xí)、聯(lián)邦學(xué)習(xí)等領(lǐng)域擁有30多項(xiàng)美國國家專利。由于業(yè)務(wù)往來的需要,兩人一直有著十分緊密的合作關(guān)系?!澳菚r(shí),全世界做同類業(yè)務(wù)的公司不到10家,而且絕大多數(shù)公司只是做做樣子。”蔡超超表示。

  幾乎所有的互聯(lián)網(wǎng)公司都是盡可能地把別人的數(shù)據(jù)拿過來,而不把自己的數(shù)據(jù)給出去。重大轉(zhuǎn)折出現(xiàn)在2017年,谷歌AI在《聯(lián)合學(xué)習(xí):協(xié)作機(jī)器學(xué)習(xí)沒有集中訓(xùn)練數(shù)據(jù)》的博客文章中首次引入了“聯(lián)邦學(xué)習(xí)”的概念。不久后,中國國內(nèi)首家民營銀行和互聯(lián)網(wǎng)銀行——微眾銀行,由于迫切的風(fēng)控技術(shù)需要,將這一概念率先引入到國內(nèi)。但應(yīng)用在落地時(shí),推進(jìn)得并不那么迅速。

  2018年年底,IDC《數(shù)據(jù)時(shí)代2025》白皮書中預(yù)測(cè),2025年全球產(chǎn)生的數(shù)據(jù)將高達(dá)175ZB,相當(dāng)于每天平均產(chǎn)生491EB的數(shù)據(jù)。其中,相較于歐洲、中東、非洲、美國、亞太(不含中國)以及全球其他區(qū)域,在未來5年,中國的數(shù)據(jù)量平均增長(zhǎng)率達(dá)到26%,預(yù)計(jì)到2022年將擁有全球最大的數(shù)據(jù)圈。

  大數(shù)據(jù)飛速增長(zhǎng)隨之引發(fā)的問題接踵而至,全球出現(xiàn)了多個(gè)用戶隱私信息泄露事件。僅2018年,F(xiàn)acebook 5000萬用戶的信息被泄露,圓通10億條用戶信息數(shù)據(jù)被出售,前程無憂195萬條個(gè)人求職簡(jiǎn)歷泄露,萬豪喜達(dá)屋5億客戶的用戶信息被泄露,順豐3億條用戶信息數(shù)據(jù)被出售,AcFun 900萬條用戶數(shù)據(jù)被泄露……隱私泄露事件頻發(fā)導(dǎo)致信任鴻溝,傳統(tǒng)數(shù)據(jù)交易無法確權(quán)定價(jià),傳統(tǒng)數(shù)據(jù)融合方式存在著極大的安全問題和高昂的管理成本。

  此時(shí)的中國,既有將來全球最大的數(shù)據(jù)圈作為基礎(chǔ),又有隱私泄露的各種危機(jī)事件發(fā)生,而數(shù)據(jù)作為生產(chǎn)要素,要產(chǎn)生經(jīng)濟(jì)價(jià)值,合規(guī)使用客戶隱私一定是發(fā)展的必然?!皣鈱?duì)使用用戶數(shù)據(jù)的監(jiān)管很嚴(yán),但中國還存在一些灰色市場(chǎng),具備良好的隱私計(jì)算技術(shù)的應(yīng)用發(fā)展場(chǎng)景,能激發(fā)新的應(yīng)用。”宋一民表示,“在國內(nèi),如果一個(gè)技術(shù)沒有從市場(chǎng)角度去反推,這個(gè)技術(shù)就很難落地,公司也很難存活。但國內(nèi)市場(chǎng)接納度非常高,市場(chǎng)滲透速度很快。”

  多方共享數(shù)據(jù)卻無需交換數(shù)據(jù)

  宋一民斷斷續(xù)續(xù)在國內(nèi)做了一些市場(chǎng)調(diào)研,2019年年初帶著創(chuàng)辦一家隱私計(jì)算技術(shù)服務(wù)公司的想法回國融資。他說:“我與一些投資機(jī)構(gòu)進(jìn)行了交流,但他們大多對(duì)這個(gè)方向沒有概念,當(dāng)時(shí)也沒有相應(yīng)的市場(chǎng)需求。但好在我們的商業(yè)計(jì)劃書在機(jī)構(gòu)圈逐漸擴(kuò)散開來,中國頂尖投資機(jī)構(gòu)的負(fù)責(zé)人找到我,他們說一直看好這個(gè)方向,但觀望了很久,沒有找到合適的項(xiàng)目。”

  2019年4月,宋一民獲得了國內(nèi)頂級(jí)投資機(jī)構(gòu)天使輪投資,他覺得回國創(chuàng)業(yè)基本具備了天時(shí)地利人和的條件。幾乎沒有太久耽擱,宋一民火速拉攏到了一幫初創(chuàng)團(tuán)隊(duì)一起回國,其中幾位是宋一民在Facebook的同事。

  “在Facebook,和我們類似資歷的人幾乎沒有人會(huì)選擇出來創(chuàng)業(yè)?!彼我幻穹Q,從這里離開,就等于要從安逸的美國生活中抽身出來。

  早期團(tuán)隊(duì)的成員姚雪潔,是宋一民北京八中的高中同學(xué)。決定和他一起回國時(shí),她是某知名電商公司的國際化產(chǎn)品負(fù)責(zé)人,已經(jīng)在美國定居。數(shù)牘科技所要解決的問題,正是姚雪潔過去在投放廣告中經(jīng)常遇到的痛點(diǎn),“如果能把廣告投放主的數(shù)據(jù)給到廣告推廣方,廣告投放的精準(zhǔn)度和效果將顯著提高,但同時(shí),如果把數(shù)據(jù)給到推廣方,數(shù)據(jù)將會(huì)被后者留存,破壞了用戶的隱私安全,這是矛盾的地方?!彼援?dāng)宋一民提出隱私計(jì)算技術(shù)時(shí),同為計(jì)算機(jī)專業(yè)的姚雪潔很快捕捉到了這項(xiàng)技術(shù)的前景。

  數(shù)牘科技很快交出了答卷。2019年10月,第一版隱私計(jì)算產(chǎn)品出爐,正式完成了基于分布式的聯(lián)合建模,實(shí)現(xiàn)了之前向投資人承諾的“多方共享數(shù)據(jù)但又無需匯集或交換各方原始數(shù)據(jù)”的效果。這意味著,大數(shù)據(jù)實(shí)現(xiàn)了真正的共享,為“多方數(shù)據(jù)價(jià)值變現(xiàn)”找到了可行之路。

  “數(shù)據(jù)隱私問題存在于數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)交換和數(shù)據(jù)計(jì)算三方面。數(shù)牘科技解決了在數(shù)據(jù)計(jì)算層面的隱私保護(hù)和數(shù)據(jù)安全,為雙方用戶在原始數(shù)據(jù)無需暴露的前提下進(jìn)行聯(lián)合建模及計(jì)算,平臺(tái)不參與計(jì)算,不觸碰數(shù)據(jù),不運(yùn)營數(shù)據(jù)?!彼我幻窠榻B,數(shù)牘的隱私計(jì)算平臺(tái),可以讓數(shù)據(jù)使用方得到數(shù)據(jù)計(jì)算結(jié)果,但無法看到加密數(shù)據(jù)內(nèi)容,對(duì)于用戶來說,數(shù)據(jù)全程加密,充分保護(hù)用戶隱私,還能保證原始數(shù)據(jù)隱私安全。

  很快,合作伙伴紛至沓來。2020年上半年,數(shù)牘科技成為聯(lián)通數(shù)科隱私計(jì)算技術(shù)提供商,同時(shí)獲得了幾大國內(nèi)頂級(jí)投資機(jī)構(gòu)的Pre A輪億元投資;同年6—7月,與中國移動(dòng)、招商金科、招商銀行、浦發(fā)銀行共同開展了多個(gè)隱私計(jì)算試點(diǎn)工程項(xiàng)目;11月,與信通院、阿里安全共同發(fā)布國內(nèi)首個(gè)隱私計(jì)算技術(shù)研究報(bào)告;同時(shí),近兩年來,數(shù)牘科技還參與了工信部信通院、中國電子標(biāo)準(zhǔn)化研究院、北京大數(shù)據(jù)中心等多個(gè)機(jī)構(gòu)的多項(xiàng)隱私計(jì)算、數(shù)據(jù)安全、數(shù)據(jù)流通分級(jí)分類的相關(guān)標(biāo)準(zhǔn)或指南。

  數(shù)據(jù)需要在場(chǎng)景中發(fā)揮價(jià)值,因此隱私計(jì)算要天然貼近業(yè)務(wù)場(chǎng)景。數(shù)牘在實(shí)踐中積累了包括銀行、保險(xiǎn)、汽車廠商、電信運(yùn)營商、政府等多領(lǐng)域的業(yè)務(wù)場(chǎng)景。同時(shí),實(shí)現(xiàn)了高安全性和高計(jì)算性能的雙重突破,已達(dá)工業(yè)落地可用狀態(tài)。

  在金融板塊,銀行原有的風(fēng)控模型受限于數(shù)據(jù)不夠豐富,在風(fēng)控能力和獲客成本等方面面臨較大挑戰(zhàn),因此,數(shù)牘科技與一些頭部銀行及頭部保險(xiǎn)公司在車險(xiǎn)定價(jià)、信貸風(fēng)控、智慧零售、小微企業(yè)貸款、反洗錢、智能投顧等方面進(jìn)行了深度合作;在政務(wù)領(lǐng)域,數(shù)牘的主要客戶為“十四五”規(guī)劃中區(qū)域數(shù)字經(jīng)濟(jì)一體化的標(biāo)桿省份客戶,如京津冀、粵港澳、長(zhǎng)三角地區(qū)的用戶;在電信領(lǐng)域,基于電信數(shù)據(jù)能力、對(duì)外開放服務(wù)平臺(tái),數(shù)牘打通了全行業(yè)互聯(lián)互通數(shù)據(jù)服務(wù)平臺(tái),同時(shí)針對(duì)電信詐騙場(chǎng)景正樣本獲取難、數(shù)量少、模型能力不足的難點(diǎn),協(xié)助移動(dòng)和電信運(yùn)用聯(lián)邦學(xué)習(xí)技術(shù),在數(shù)據(jù)安全的前提下,融合雙方數(shù)據(jù)及模型經(jīng)驗(yàn),提升詐騙賬號(hào)識(shí)別能力,將電信反欺詐場(chǎng)景落地;在互聯(lián)網(wǎng)領(lǐng)域,數(shù)牘與大型互聯(lián)網(wǎng)廣告平臺(tái)及廣告主合作,基于隱私保護(hù)的廣告及營銷協(xié)作場(chǎng)景等。

  創(chuàng)業(yè)之后的“甜蜜負(fù)擔(dān)”

  技術(shù)靠場(chǎng)景打磨。一個(gè)技術(shù)能發(fā)展出多個(gè)方向,而具體要選擇哪個(gè)方向要看市場(chǎng)的反饋?!懊绹S多科技公司和國內(nèi)的一些早期的實(shí)踐者,在探索類似技術(shù)時(shí)還沒有機(jī)會(huì)在真正的大環(huán)境中落地,沒有辦法提煉出研發(fā)技術(shù)的關(guān)鍵邊界,也不清楚如何去判斷提升的優(yōu)先級(jí)。但中國有培育這個(gè)技術(shù)天然的市場(chǎng),數(shù)牘科技在幾大運(yùn)營商和頭部企業(yè)的場(chǎng)景中通過實(shí)際的業(yè)務(wù)落地也在快速地落實(shí)相關(guān)的積累?!彼我幻駨?qiáng)調(diào),“這一類場(chǎng)景,F(xiàn)acebook應(yīng)該都沒有機(jī)會(huì)去實(shí)踐?!?/p>

  “從2019年年底到2020年年中,某數(shù)據(jù)爬蟲隱私泄漏事件的出現(xiàn),讓大家意識(shí)到個(gè)人隱私保護(hù)的重要性,數(shù)據(jù)監(jiān)管政策收緊,市場(chǎng)突然有了迅猛的發(fā)展?!睋?jù)悉,中國目前有100多家企業(yè)都在做類似業(yè)務(wù),有高校科研團(tuán)隊(duì),有社會(huì)企業(yè),因?yàn)楹芏嗥髽I(yè)都意識(shí)到了這塊技術(shù)在未來的發(fā)展。

  “2020年,在疫情的影響下,數(shù)牘科技全年?duì)I收達(dá)千萬級(jí)人民幣?!彼我幻穹Q,2020年的上半年,公司幾乎沒有簽任何合同,但從10月開始的3個(gè)月內(nèi),合作方陸續(xù)找來,一舉反超了“年?duì)I收力爭(zhēng)達(dá)到800萬元”的年初計(jì)劃。

  成績(jī)很明顯,但宋一民也有了“甜蜜的負(fù)擔(dān)”。他笑言,因?yàn)樽约旱暮芏嘈袨闀?huì)被看作代表數(shù)牘科技,如今自己說話做事少了很多自由灑脫,他的朋友圈幾乎沒有任何文字和圖片的分享。但實(shí)際上,他使用微信十分頻繁,“每天早上醒來,微信里的未讀消息都有幾百條。”他拿出手機(jī)看了看數(shù)字,“現(xiàn)在是523條?!?/p>

  從一個(gè)全球頂尖互聯(lián)網(wǎng)企業(yè)的技術(shù)負(fù)責(zé)人轉(zhuǎn)變?yōu)閯?chuàng)業(yè)團(tuán)隊(duì)創(chuàng)始人,宋一民現(xiàn)在必須要為自己一手創(chuàng)辦的數(shù)牘科技負(fù)責(zé)到底。他說:“我每天都在面臨各種類型的隨機(jī)挑戰(zhàn),這些挑戰(zhàn)可能是我以前從未經(jīng)歷過的?!?/p>

  末了,宋一民笑言,“這么看起來,創(chuàng)業(yè)仿佛不是一個(gè)性價(jià)比很高的決定?!钡陔[私愈發(fā)受到尊重的當(dāng)下,在隱私計(jì)算這個(gè)全新的賽道,擅長(zhǎng)宏觀戰(zhàn)略思考和方向判斷的宋一民一定是一個(gè)優(yōu)秀青年創(chuàng)業(yè)家的典型樣本,沒有理由也不會(huì)選擇輕松的、“性價(jià)比很高”的人生。他注定會(huì)和數(shù)牘科技這匹黑馬一同,隨時(shí)代浪潮奔涌向前,讓數(shù)據(jù)的控制權(quán)回歸到擁有者手中。這個(gè)理想的實(shí)現(xiàn)也許路途艱辛,但一定不會(huì)漫長(zhǎng)……


  (責(zé)編 惠寧寧 美編 劉曉瑩)


編輯:王思含