Math Show #002 – 由点到面,深度了解Filecoin

​4月29日晚7点,麦子钱包举办了Math Show第二期,有幸邀请了Filecoin挖矿领域的知名矿机厂商1475联合创始人Andy与我们麦子钱包的联合创始人及CTO Eric 给我们讲「由点到面,深度了解Filecoin」,主持人是星际视界IPFSNEWS联合创始人Nancy,以下是当晚的精彩撰录。

Andy:

大家好,我是Andy,1475的联合创始人。我们1475成立于2018年5月,全称是天茹科技。在测试网期间,我们帮官方修复了一些bug,升级至一个稳定版本,最后官方在社区找了这个节点,随后在整个测试网期间,我们在算力和出块始终保持第一位,慢慢就更多人知道我们了。

Eric:

大家好,我是Eric,麦子钱包CTO。麦子钱包“可能”是目前支持公链最多的钱包,我们目前已经支持的公链有40多个,包括Filecoin的钱包支持也正在开发中。

我在16年的时候参与以太坊在上海办的DevCON2,第一次了解到IPFS,那个时候以太坊的Swarm分布式存储协议也挺火的。也是因此对区块链产生兴趣,加入到这个行业。

做麦子钱包是因为那时候每出一个新的公链,都需要下载一个单独的钱包,就想说能不能做一个用户体验统一的多链钱包,并整合打通这些公链的交互操作。

几年下来,麦子钱包也已经累积了近百万的用户,证明当初这个方向的选择还是正确的。

主持人:

作为一名行业比较老的IPFS媒体人,我今年一个非常深刻的感受就是Filecoin这个赛道非常火热,这个火热程度已经远远高出了去年,为什么今年这么火热?为什么Filecoin 赛道这么值得我们关注?

Andy:

经历过17年的人应该都知道 Filecoin,它的愿景是真正实现底层分布式存储的商业应用,而且在非常短的时间内就完成了2.57亿美金的融资。这波比特币减半的行情是一个大的共识和预期,再加上Filecoin这样顶级的应用项目能够上线,下半年可能真的会带来一波更好的行情和机会。

Eric:

我们现在访问网站用的是 http:// 开头,也就是 HTTP 协议,IPFS协议访问则是通过 ipfs:// ,它同样能够访问网络上各种资源,而且因为它分布式的特性,加上FIlecoin提供的激励层,它的访问会更稳定、容错和保护隐私。

大方向上,IPFS是有可能取代HTTP协议的,也就是美剧《硅谷》中抛出的设想,一个P2P的网络世界,没有大公司,生态扁平化,每个人闲置的存储空间都可以租出去给别人使用。

这几年有很多对目前互联网的反思,目前互联网的趋势和状态是否有助于推动技术和人类文明进步?我们看到的是消费互联网巨头们的生态正在越来越封闭。

我之前一直使用印象笔记的微信插件保存我觉得不错的好文章,方便之后自己检索,但最近微信把这个第三方接口也停了,你只被允许分享给腾讯生态内部的产品。

从这个意义上,IPFS协议将使得互联网数据更加开放、更加结构化,使计算机能够深入理解和使用数据。如果DEFI是开放式金融的开始,那么IPFS/Filecoin会是开放式数据生态的开始。

主持人:

Filecoin挖矿和其他项目相比有什么特点呢?

Andy:

先来对比一下Filecoin和比特币挖矿的区别,那大家都应该知道,比特币挖矿是基于POW的共识机制,那它相当于是做一道计算题,当你的计算能力越强,你的计算次数越多,那你最终答对这道题的概率也就越大,也就是打包区块的概率越高。

Filecoin是一个基于存储的一个挖矿,但它又跟POC不一样,POC相当于是硬盘挖矿,当你的硬盘容量越大,你填充了一些数据,也就是所谓的P盘,你的硬盘容量越大,你可以挖矿的概率就越高;但是Filecoin的概念叫有效存储,当你存储的数据被网络验证之后,才能称之为有效存储。你的有效存储越多,最终出块的概率越高。

再从另外一个维度来看,绝大部分的挖矿其实都是基于共识挖矿,最终买单的是对这个币有信仰的人,而Filecoin的挖矿是基于商业价值,他的核心是在于有效存储,或者说是被网络验证的存储,存储越多出块率就越高。被网络验证存储其实就是你实实在在地帮别人存东西,这实现了它的商业价值,所以它的挖矿不仅仅有共识成分,还有商业价值成分。从某种维度上来说,它其实比其他的挖矿项目有更大的商业逻辑,而且形成了更好的商业闭环。

Eric:

在我来看,其它挖矿的项目,不管是POW还是POS,目的是给链提供持续的安全性,在链本身安全的基础上,再去发掘应用场景、商业模式。Filecoin挖矿属于天生自带应用场景,因为文件存储服务有现成的商业需求和商业模式存在。当然这种挖矿需要解决一些更具体的问题,比如矿工要证明自己的存储内容是有效的、可以被读取和复制、不是无效的刷量数据等。Filecoin针对这些方面有很多独特的设计,也是这个项目有趣的地方。

主持人:

我知道Andy的团队是从18年5月就开始研究Filecoin挖矿,到现在已经快两年时间,能不能给我们Math Show的小伙伴分享一下最近Filecoin开发和测试方面的一些进展?

Andy:

测试网二阶段的时间定在了5月11号的那一周,主网上线时间会在7月21号到8月20号这个时间段,属于主网上线的窗口期,如果在二测阶段相对稳定,它就会进入代码审计,后期会再选择合适的时间点进行主网上线。

关于测试网二期有没有奖励,官方也是明确了只会拿出100万以上的Filecoin进行奖励,如果按照现在六月的期货将近50人民币左右的话,相当于拿出五千万人民币作为测试网奖励,这个数额在整个区块链行业来说还是比较大的,如果未来币价还会上升,那可能就是超过一个亿。

当然,跟随测试网二期的奖励,还有一部分的奖励是给到大矿工,因为官方做了一个叫5PB大矿工节点计划,我们也有参与了部分方案的设计。

这里的5PB指的是有效算力,也就是说真实被验证的存储达到5PB,而不是5PB的硬盘容量,估计行业内没有多少家能够真正达到,也就意味着能够进入5PB大矿工测试的也就是行业内的头部企业。那这个5PB大矿工测试是为了什么呢?因为官方其实之前更多的是在逻辑、代码层面去做一些验证,但是还没有做全面的压力测试,从技术的角度来说,在你没有达到量或者说压测的环境下,你是发现不了一些新bug的。

包括最近也发现一些新问题,当你的有效存储越来越大,或者Power越来越大的时候,你在每次做出块计算时,你的计算量会非常大,最终会遇到瓶颈,所以整个5PB大矿工的测试也会对于整个Filecoin项目起到一个关键作用,也是保驾护航的方式吧。

还有一个跟大家息息相关的经济模型,经济模型的框架也在上周进行了发布。目前它是框架化的,它可以通过调整参数去确定最后经济模型的数值。Filecoin的经济模型会比其他项目的经济模型复杂得多,因为这不仅仅是一个转账的事情,它涉及到真正的商业应用(存储),所以对于抵押、奖励、惩罚,或者说释放机制,它都有建立一套完整的模型架构。

随着各个模块的完善,测试网二期的上线日期应该不会有太大的变化,而且代码的完整度已经非常高了,可能在最后还会做一些调修,这也能让更多配置没那么高的硬件能够参与进来。

主持人:

刚才Andy跟我们分享1475这个编号的由来,是因为在测试网时找到了一些官方的bug而被熟知,那你们会在每一次测试都用1475这个编号吗?

Andy:

首先说一下,这是一个偶然事件,因为在整个Filecoin的测试网期间,他用的是一种叫lotus的实现方式,在这里面你每次接入测试网的时候都需要先申请一个矿工编号,我们也只是随机拿到这个数。

后来我们帮助官方修复了一些bug,井且在社区里做了一些升级和优化,所以官方就在社群发言说要找到1475节点,想知道这个节点背后到底是谁。后来,也因为我们长期在榜单上排在前面,关注我们的人也越来越多。1475是一个偶然的编号,每一次更新时会有不同的编号,主网上线的时候会有四种实现方式,但不是最终都会以lotus方式去实现,但是这个不影响我们。

再补充一下,Filecoin是在去年的2月14号开源,井且同步上线了开发网,在那个网络里,每个人都可以给自己取一个名字,我们其实第一时间参与了那个开发网的测试,在大部分的版本中也都拿到了第一名的成绩,但是我们当时一直没有用我们公司的名字,像国庆期间,我们取名叫 I love China,那个节点也长期保持在第一名。

我们的团队花了很多精力在Filecoin的底层研究,去优化、开发,当然最终目的也是为了实现挖矿的投入产出比的最大化。

主持人:

今年Filecoin这个赛道非常火,钱包的赛道跟Filecoin的生态有什么结合点吗?Filecoin生态在钱包里会有哪些机呢?

Eric:

最简单的结合点肯定是钱包能够支持Filecoin的存储和转账操作。但除此之外,Filecoin其实会和钱包的跨链生态和区块链应用紧密相关。

我们最开始做的以太坊钱包,以太坊钱包初期除了资产的功能,还支持两个协议,分别是Swarm分布式存储和Whisper分布式消息,所以以太坊钱包早期是支持直接上传文件到分布式存储的。

18年的时候我们做EOS钱包支持,EOS的第一版白皮书里面其实也提到过使用IPFS搭建文件存储系统,给DAPP提供一站式的服务。可以看到,去中心存储对于区块链应用和钱包生态是一个非常重要的环节,甚至会带来一些颠覆式的创新。

举个更具体的例子,目前对一个DAPP的标准定义是它能够把Token和资产相关的业务逻辑通过智能合约放到链上,其余的部分(比如:前端页面、智能合约的调用代码、相关图片、链外数据)都是中心化存储的,这些部分很容易被篡改,而且同样会导致各种安全问题,比如恶意地修改智能合约调用的前端代码,从而修改用户钱包权限等。而如果通过去中心存储,我们就可以给用户提供审计过的 ipfs:// 协议开头的DAPP入口,如果内容被修改,那么相应的入口地址也会被修改,从而更好的保障用户使用的安全。

主持人:

观众提问Andy,据说filecoin挖矿设备要求非常高,以后价格会不会很贵,会不会影响普罗大众的参与储存热情?

Andy:

首先,现在Filecoin代码的实现跟白皮书里开始预期的肯定有比较大的差距,它最开始还是希望所有的硬件设备都能参与进来,做到真正广义上的去中心化,或者说分布式。但是,随着代码逐渐的完善及发现,中间其实有很多难点,为了保证安全,很多的计算量会大幅提升,在效率上肯定会做折中。

从最新官方修改代码的方向来看,接下来的一段时间会花精力在优化代码,从而降低硬件成本,比如现在完成整个扇区的封装需要的一台256GB内存的机器,但市场上绝大部分服务器的内存都是32GB或者64GB。官方现在也在进行算法上的优化,希望把256GB降到128GB,在确保整个底层代码安全稳定的情况下去降低门槛。

当主网上线之后,矿工最后看的并不是矿机的价格,而是投入产出比,也就是说多长时间才能回本。就像比特币时代的机皇S9,最便宜的时候只有600到800元一台,但是贵的时候也卖到了三万多元。所以一旦上线后,它就是一种金融投资品。所以我觉得最终的积极性还是取决于整个项目的未来发展,包括币价和生态,而不是说机器本身的价格。

主持人:

观众提问Andy,Filecoin怎么解决因为挖矿可能导致的垃圾数据问题,是否会因此导致真正的存储需求反而因为成本太高不愿意进入?

Andy:

现在在lotus,测试网的环境下是支持用户自己刷单的,那就意味着现在矿机里绝大部分数据都是刷单的垃圾数据。

但是我们可以回过头来看,在生态的发展过程中,最开始就是通过刷垃圾数据去获得区块奖励,从而吸引更多机器、硬件设备投入到这个赛道来,只有当硬件设备或者基础建设达到一定规模后,整个网络的稳定性和效率才能进一步提升,才会有更多人愿意进来开发应用。当真正的有效的数据进来时,作为矿工就会选择存有效数据。

同样在官方的角度而言,在这次经济模型中,我们看到了官方对于刷单的数据和有价值的数据的最终权重是不一样的,可见官方其实把精力都放在了未来的应用落地,也一直希望能够引导矿工去存储真正有效的数据,而不是纯粹刷单。

从存储内方角度来看,因为它是一个分布式,或者说去中心化的市场,最终存东西的花费是取决于市场的供需关系。只要有足够的矿机在赛道里,就有大量的容量供给层,那存数据的成本就极低,那接单的人(存储的人)完成存储又能获得奖励。早期在有大量闲置硬盘接入到这个网络的阶段,存储费用是非常低的。

主持人:

观众提问Andy,后端的存储空间设计才是整个filecoin最核心点,是每个矿场的最核心竞争力,可以说没有高质量的存储空间管理,你什么都挖不到,怎样鉴别市面上矿机公司的能力?

Andy:

在硬件价格不变的情况下,硬盘容量总量就这么多,所以文件管理不会有特别大的区别。我谈谈对于挖矿效率的看法,首先,前面提到出块率的核心参数是有效存储,有效存储就是经过网络验证的存储,那有效存储怎么来的呢?其实是把原文件进行碎片化后,再进行多重加密,包括了串行的加密,也有可并行的形成默克树的过程,然后通过零知识证明,最终把计算出来的哈希发到链上去进行验证,所以这个过程会非常复杂,消耗巨大的计算资源。

那在这个阶段谁能够更快完成计算,也就是说把这些数据完成封装成为有效存储、有效算力,就决定了这个机器的挖矿效率有多快。在这里有很多维度可以做,从硬件的匹配,到挖矿软件的开发,再到算法层面的开发,这也是我们花了整整两年时间一直研究的。也就是说,从Filecoin的底层代码的算法优化,再到整个挖矿软件系统管理的优化,再到我们选型最终的硬件,这一整套的系统集成方案,或者说一整套的解决方案,最终呈现给大家的是一个投入产出比最高的产品。

当然,除了本身矿机的挖矿效率之外,还有一个非常重要的就是运维,因为Filecoin不像比特币挖矿,Filecoin是有抵押物的,无法随时撤出,毕竟你的矿机里存了别人有价值的数据,那它就会锁定你一份FIL,不让你随时退出。这个时候你矿机的稳定运行,包括电网、程序的稳定性都起了非常重要的作用。所以在后期,运维是非常重要,就像矿场要确保不会断电、断网,矿机是否有监控系统,检测它有没有异常,硬盘坏了,内存溢出了,或者说整个挖矿系统为什么长期不涨算力不出块,这里面有非常多的因素,都是需要一整套运维系统去管理。

所以Filecoin挖矿跟其他挖矿差别很大,他需要团队有非常强的综合能力,比如软件的能力,硬件的能力,运维的能力,甚至在矿场现场的管理能力,所以想真正做好Filecoin挖矿,或者说想追求更高的投入产出比,一定要去评估市场上各家的实力。

主持人:

观众提问Eric,  Filecoin能否解决公链目前对数据存储的需求?是否会提供类似Chainlink预言机的数据存储解决方案?

Eric:

目前Filecoin链的状态就是通过IPFS保存的,所以保存是没问题的,更多应该是基于一个成本、隐私、稳定性的考量。

麦子钱包有一个合作项目Phala是做隐私计算的,他们的设计就是把需要计算的数据加密后保存到Filecoin网络,因为去中心化存储能够确保数据的所有权归属用户、确保服务的可持续性,减少中心化云存储(公司)单点故障风险。FIlecoin网络提供了成熟的解决方案,并且保证了隐私的基础:去中心化、去信任化。

Chainlink预言机做的更多是把数据上链的过程,而非满足数据存储需求,所以目前阶段应该是两个不同的场景。

但从Filecoin的规划上看,之后Filecoin网络是会支持智能合约的,所以Filecoin之后也许可以拓展到更多场景中去,目前关于Filecoin智能合约的设计方案具体内容还较少,需要关注后续更新的情况。

主持人:

非常感谢今晚的分享,大家可以参与Math Show发起的“你想见到的那个他/她”活动,推荐并且助力你想在”Math Show”见到的嘉宾,有机会成为惊喜MC与你想要见到的嘉宾面对面对话。

链接:http://mathshow.mikecrm.com/2QEz163

再次感谢大家的时间和聆听,我们下一期不见不散。