1,吴恩达表示AI是时候从大数据转向小数据了,目前面临着哪些困难?
吴恩达表示AI是时候从大数据转向小数据了,目前面临着哪些困难?举几个之前接触过的例子:机场安检x光识别系统,机场方提供半年的x光图片做训练,半年中真正带小刀,酒等过安检的样本只占总样本不到5%。信用卡反欺诈,真实场景下,欺诈样本总数不会超过正常样本的1%通过AI找出生产线上某零件中的残次品,关于零件的图片在项目开始前啥都没有,项目负责人承诺可以根据要求和行业专家对残次品的定义临时去拍。不是不想用大数据去大水漫灌大模型,是条件不允许呀。这些场景中,更关键的是通过行业专家的知识正确定义问题,并指引这些行业专家提供能解决问题的少量高质量样本训练模型。个人理解:基于小数据开发AI模型是趋势,更是目前工业AI的现状。从目前已经落地应用的AI软件来看,主要存在以下几个方面的问题:对于应用场景的依赖性较强。目前对于应用场景的要求过高是AI软件落地应用的重要障碍之一,这些具体的要求不仅涉及到数据的获取,还涉及到网络通信速度以及相关“标的物”的配备。随着5G通信的落地应用和物联网的发展,未来场景建设会得到一定程度的改善。技术成熟度不足。目前有不少所谓的AI软件,实际上更多的是基于大数据技术的一种拓展,所以给用户的应用体验往往是“智商偏科、情商为零”。当前由于人工智能的技术体系尚未完善,所以AI软件要想达到一定的成熟度还需要很长一段时间。当前在生产环境下,有很多AI产品依然存在较大的缺陷,不少行业专家依然不敢大面积使用人工智能产品。对于应用人员的技术要求比较高。目前很多人工智能产品需要进行二次开发(编程),这个过程往往需要使用者有一定的技术积累,这也是导致当前人工智能产品落地困难的一个重要原因,尤其是对于广大的中小企业用户来说,搭建一个技术团队往往并不现实。要想解决人工智能产品(软件)存在的这些问题,除了要完善目前人工智能产品的应用场景之外,还需要行业专家参与到人工智能产品的研发中,这是解决人工智能产品落地应用的必要环节。随着当前不少人工智能开发平台的推出,未来将有大量的人工智能应用推向市场,这也会在很大程度上推动人工智能产品的落地应用进程。
2,吴恩达称AI是时候从大数据转向“小数据”了,你认可这个观点吗?
我个人很认可吴恩达的这个观点,因为我就是大数据专业的研究生,我最近研究的话题也是这个。因为这个话题有点高端,一句话说不清,下面我仔细讲一下。以下内容皆为个人观点,仅供参考!1.为什么我认可吴恩达教授的观点?首先,我们要清楚大数据是什么,简单来说,大数据就是海量的数据,在零几年的时候,因为那时候技术有限,我们没办法处理这些数据,这些数据被当作是垃圾。但在一零年后,计算机技术开始发展,我们有了处理海量数据的技术能力。大数据其实就是从海量的数据从清洗掉那些没用的数据,然后再从剩下的数据中找出对自己有用的数据,最后再进行分析。吴恩达教授说的大数据就是前者,“小数据”就是大数据经过清洗并挑选出来有用的数据。因为搭建一个海量数据处理平台的成本很高,大部分企业是无法接受的。而且训练AI的话,真正有用的数据也就是这些清洗过后挑选出来的数据,用我们导师的话来说,一万条未经过清洗和挑选的信息还不如十条经过挑选的信息。这也就是我为什么认可吴恩达教授观点的原因。2.更进一步聊聊这个话题其实吴恩达教授说的AI是时候从大数据转向“小数据”了的说法,并不是说大数据没有了,他这句话里面明确来,AI转向“小数据”的前提还是大数据,因为AI想要得到“小数据”,也还是要从大数据中获取的,所以其实这也是在说,未来,大数据处理公司将会很受欢迎,甚至是很多行业的基石。扯远了,回归正题,总的来说,我是认可吴恩达教授的观点的,因为他的观点和我的研究方向有异曲同工之妙。