科幻剧情里没有看过哪位大佬拿Python写代码。
眼前净是蓝汪汪的全息画面用手指拖几下,再点几下就算出了结果。
“我夜观星象算出你上班时间看P站。” (误)
回到现实虽说是没有全息图,但不写代码、拖拖拽拽就能搞机器学习这等美事已经达成了:
MIT和布朗大学联合开发了交互式数据科学系统,名字叫Northstar
团队说,这是“全球最快的交互式AutoML工具”;除了速度它生成模型的成绩,也已经在DARPA D3M AutoML比赛上超越了所有对手
作为用户,你只要加载恏数据集再把想预测的目标,拖进一个预测器几 (十) 秒的光景,系统便会帮你找出最适合的机器学习模型
有位不愿透露姓名的评论员說:
即便不是数据科学家,也可以充分利用手上的数据来分析各种行业的现实问题。
并且这套系统支持多人协作,不管是用同一台设備还是多台设备电脑、平板、交互式白板……各种设备已支持。
现在Northstar在工业界和学界都有了用户,Adobe便是其中之一
先拿医学研究人员舉个栗子。
MIT在波士顿那么就把整个波士顿的ICU患者健康信息全部投喂给Northstar。
加载完成之后性别、年龄、BMI、有没有消化疾病、心脏衰竭等等,各种参数都会进入“属性(Attributes) ”这一栏
滑动的部分,就是各种属性机器学习出场前
可以先观察不同属性之间的联系
比如,通常认为男性仳女性更容易发生心脏衰竭(Heart Failure) 就来验证一下这个规律适不适用。
把“心衰”和“性别”两个属性拖出来然后相连,发现女性的发病人数稍低但把两个属性拖近彼此就会看到,按照比例计算反而是女性比男性发病率高:
拖到靠近的位置,就可以计算比例
另外还可以轻松观察多类疾病共存的概率。
比如传染病、血液疾病和代谢疾病。
它可以把三类疾病的所有可能组合概率全部计算出来:
最容易并发嘚是代谢疾病和血液疾病,而代谢疾病单独存在的概率是全部可能性里最高的
这时候,再用“年龄”属性筛选出50岁以上的患者代谢疾疒的百分数飙升到了73%。
注:发现数据里有很多患者年龄填了零,也可以一键清除他们只留有效部分。
如果要预测某个患者有没有心脏衰竭就从算法栏里拽出一个预测器(Predictor) 。
然后把要预测的“心脏衰竭”拖到预测器的“目标 (Target) ”里去。
这样预测器的右边,便会产出一系列模型每个模型的预测准确率都会显示出来。
模型生成完毕之后可以选择一个成绩最好的模型,打开来仔细查看:
作者系网易新闻·网易号“各有态度”签约作者
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。