News产品中心

精确查询:

产品中心

像Git相通用AI数据免费托督东西上线用「活」数据集熬炼

发布时间:2021-06-14 08:02:49
来源:欧洲杯足球投注网

  表洋,一位名叫Simon Lousky的秩序员幼哥终究不行忍了,开拓出了一套用于呆板进修的数据版本支配用具(Data Version Control,DVC)。

  一键移用数据集、一键查看编纂汗青最要紧的是,正在DVC用具背后,有一个GitHub相通的数据托管社区。

  Simon Lousky正在学生期间做项目时,就仍旧感染到了呆板进修数据集处置未便的痛点。

  当时,他的模子需求一个植物和花朵的数据实行演练,而开源数据集无论何如也得不到合理的结果。

  于是他我方花了几个幼时的时代,逐一删改了数据齐集洪量过期、分歧理的标注,之后演练结果让人相等如意。

  除了这个项目,他之后又实行过良大都据集的删改、补充、创筑管事,他把这些费时辛苦的工序称为“数据集的调尝尝错”,而且早先成心记实操作汗青。

  他渐渐觉察,我方的项目中,数据处置老是乌烟瘴气,而依附GitHub托管的代码,却从来有层有次。

  这是一个预装的用具库,完毕功效蕴涵对数据集的移用、楼宇自控系统原理图汗青操作消息的查看等等功效。

  它的展示,意味着之前,考虑职员正在当地“死”的数据集上演练模子的方法彻底改观。

  你可能将项目链接到正在线托管的数据集(或任何文献),筑树及时、无误的干系。数据集的任何更新改观,都能实时获知,简单项方针展开。

  譬喻,现正在有一个Repository A,这是一个“活”数据集,个中元数据文献,指向存储正在专用效劳器具体凿大文献。

  用户可能将数据集文献结构到目次中,并增加带有utils函数的代码文献,以此来简单移用。

  其它,尚有一个Repository B,这是对应呆板进修项目,项目代码中,包括行使DVC导入数据集的指令。

  然后用户只需求把代码和数据推送到托管堆栈,如此就随时随地访候它,并与其他人分享。

  DAGsHub即是一个GitHub的数据处置版本,由三部门构成,git堆栈、DVC、和呆板进修流程平台mlflow。

  用户可能提交我方的项目,DAGsHub会自愿扫描提交,并提取有效的消息,如尝试参数,数据文献和模子的链接,并将它们联结到一个粗略的界面。

  DAGsHub可能浏览和较量代码、数据、模子和尝试,并且不需求下载任何东西。

  其它,还能天生可视化数据管道、数据操作汗青,并记实模子功能,自愿且雅观。

  逐日头条、业界资讯、热门资讯、八卦爆料,全天跟踪微博播报。各类爆料、内情、花边、资讯一扫而空。百万互联网粉丝互动到场,TechWeb官方微博期望您的合怀。

  Q1环球10英寸及以上OLED屏幕贩卖额14.5亿美元 同比大增156%

  电信、联通等四家企业成为openEuler理事会成员,百度正式插足社区

  区块链企业迎“战略性盈余”,本年前五个月注册量新增1.56万家,同比增加155%

  Q1环球10英寸及以上OLED屏幕贩卖额14.5亿美元 同比大增156%

  蚂蚁自研数据库OceanBase宣告开源 300万行中央代码向社区盛开

  高通推出环球首个10Gbps 5G M.2参考计划,加快推动5G正在新兴细分墟市中的普及


上一篇: 万能型用具 Notion:条记使用的解散者
下一篇:细密型换取直流配电柜价值
联系我们
合作伙伴

分享到:

手机扫一扫,有惊喜

地区/国家:
版权所有:欧洲杯竞彩网 沪ICP备08025922号