当前位置:首页 > 业务领域 > 污泥处理 >

菜鸟网络算法专家朱礼君:物流优化问题在大数据时代被赋予新的意义​|CCF-GAIR2017_热电竞

编辑:热电竞lol竞猜 来源:热电竞lol竞猜 创发布时间:2020-12-26阅读95333次
  

【热电竞lol竞猜首页】2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR会议在深圳成功举行。本次活动由CCF中国计算机联合会和香港中文大学(深圳)主办。来自世界各地的30多位顶尖院士和近300家AI之星AI企业齐聚智能科技产业盛会。菜鸟网资深算法专家朱丽君在CCF-GAIR 2017上做了主题为“大数据时代物流优化”的公开演讲,主要介绍菜鸟网物流发展情况。

朱丽君毕业于马里兰大学,获得物理学博士学位。曾在高盛、亚马逊、Facebook等公司工作,2014年回国重新加入阿里巴巴,领导菜鸟网络仓库和供应链的算法团队。以下是朱丽君演讲速记全文汇编。

(微信官方账号:)在不改变初衷的情况下精心编制:我来自菜鸟网,分享大数据时代的物流优化问题。我们在物流优化方面遇到了很多问题。

物流只是一个有几千热电竞lol竞猜年历史的非常古老的行业。然而,在这个大数据时代,我们发现了许多传统运筹学优化问题,这些问题在大数据时代表现出了许多新的含义。

我们在这方面做了很多研究,遇到了很多有趣的问题,也教了很多经验在操作过程中与大家分享。菜鸟网是传统产业和物流产业的融合。首先,我们来解释一下菜鸟网。

菜鸟网是一个物流平台,与物流合作伙伴合作,为消费者和商家获取物流服务。还包括汽车租赁、仓储配送网络、跨境及码头网络、农村物流网络。值得一提的是,这个区域的很多节点,比如仓库和仓储,最后一英里等等。我们仍然使用社会物流资源,这是我们合作伙伴的资源,但是菜鸟网络不会在这方面发挥全局优化作用。

刚才我们的一个特点就是传统行业和物流行业的融合,因为物流行业是一个非常传统的行业,但是我们是互联网公司,是数据公司,所以数据是核心,技术是核心。互联网时代,许多传统的物流优化问题确实被赋予了许多新的含义,大数据和算法是核心。大数据时代物流优化的新意义大数据时代我们的物流优化问题被赋予了什么新的意义?经过我们的研究,我们发现,首先我们计算了很多物流优化问题的性能拒绝比以前小。之前我们并没有太在意计算资源的优化使用,因为之前的优化明天忘了用,现在是动态的,所以对算法有相当大的挑战。

此外,机器学习和人工智能也提到了很高的水平。在物流领域,以前使用传统的生物技术优化理论和算法。

在大数据时代,两者必须更好的有机融合。我们最近在研究的另一点是如何利用机器学习的思想来解决传统的物流优化问题,这也是学术界一个很有挑战性的新方向,我们在这个过程中也有一些经验。

物流算法在案例中的应用让我们分享一些在菜鸟网做过的案例。第一个问题是供应链仓储网络的优化,这是一个非常传统的问题。我们的一些客户在全国或全世界都有区域生产。我们应该选择哪个仓库配送,哪个仓库储存货物,从供应商到仓库,最后到用户,这是一个传统的问题。

为什么我们要指出这个大数据时代有了新的意义?在阿里的电商平台上,商家只负责管理自己的商品。之前他不会用自己的存储网络,我们也不会优化每个商家。比如优化后,有些商品可以放在菜鸟仓库,老板会存储,但不会覆盖某些区域。

举个例子推荐一个深圳的商家之前可能在深圳有仓库,北京的用户必须远程发货,但是菜鸟在北京有仓库,我们可以推荐这个商家用我们的仓库在北京附近发货。有许多优化目标必须考虑。除了成本,及时性就不考虑了。

第二天预约的体验对用户来说很重要,还有就是商品配送的成本,也就是供应商运输到仓库需要多少成本。一般我们用混合编程模型是不会解决问题的,所以拒绝很慢。我们专门设计了一些算法来解决这个问题。

我们有成千上万的业务,每个业务都需要单独解决,所以传统的优化算法不会有一定的局限性。商家选择我们的仓库,我们要告诉他仓库怎么分,北京的仓库要放多少货,上海的仓库要放多少货。这个问题看似很简单,其实不然。即使我用机器学习模型根据历史数据预测北京上海的销量,也还是太多了,因为机器学习模型有很多不确定因素。

热电竞竞猜

它预测未来的销量不会有很大的波动,我们也告诉国内的电商,广告会很多,所以这个波动不会更大。如何才能把这些波动考虑进去,才能保证我的补货量在一些不确定的环境下更合适,会出现短缺和短缺。所以要考虑商品配送和仓储的成本,再考虑定期补货,是一周一次,两周一次,还是一个月一次。

最重要的一点是要考虑销量的波动,因为销量很不稳定。然后,在整个补货量确定后,我们创建这样一个模型,并使用鲁棒优化算法来计算每个仓库需要补充多少。这个算法对于每一个商品,每一个商家也是个性化的,所以也是一个难题。在仓储领域,我们告诉仓库,用户下单后,仓库里就没有仓库人员了,他们会在仓库的货架上调头,把用户下单的所有订单都拿起来,然后打包发给用户。

这里最重要的问题是如何重复任务,如何优化路径。任务重复是指哪个顺序应该先给哪个人,路线优化应该怎么先给这个人。这两个问题相互融合,是一个类似于车辆路径规划的问题。这里的问题是,特别是在电子商务这样的平台上,订单发出量很大,所以我要满足一个要求的时候一定要告诉,哪些订单爆给一个工作人员,让他去货架上取,所以这是一个必须动态做出的问题,它对计算出来的性能的拒绝度也很低,因为仓库里的工作基本都是转来转去,中途就停了。

所以需要快速计算下一个任务会发给谁,然后大幅度下达订单。这是一个非常动态的问题,不可能用一些传统的生物技术优化算法来解决这个问题。

仓储领域还有一个有趣的问题。有可能人们不会意识到这个问题看似简单,其实是一个盒子推荐的问题。 比如用户在这个网站上买了8件,一个用户卖了8件或者10件。

这是一段很长的时间。这些物品都有长方形的低矮和沉重。

我告诉了我仓库里箱子的大小和能装多少。问题是在下订单的那一刻,我要告诉这些物品怎么去二垒,然后放在哪个箱子里,或者只放在下一个哪个箱子里,我只想放在哪个箱子里。如果一个箱子能装,那就是一个包裹,但是如果我把它分成两个包裹,就不用两个包裹一起运输了,降低了存储成本,而且这个箱子的包装材料也浪费了,所以这个算法可以充分发挥相当大的空间。

这个问题是学术界传统的三维装箱问题,是一个很没用的问题。它的约束是当货物堆积在一起时,它的矩形低不能低于那个箱子的矩形低,这是大家都能想到的约束。一般的传统方法是用构造性算法,就是我尝试不同的放置形式或者不同的放置顺序,然后一定要做一些语言启发算法,就是把一些启发式算法整合在一起,设计一些分层的算法。

假设你有100个商品,一个简单的算法很可能计算不出来,因为我们必须在短时间内计算出这个,并且在下订单的过程中计算出来。不算的话以后也不会卡,所以这个算法的挑战性还是挺大的。解决完这个问题后,我们自己思考了一下。

这里有一个很重要的约束,就是当商品堆积在一起时,它们的矩形不低于这个盒子的矩形。然后我们问自己,这个约束有必要吗?其实不是。因为我们可以根据一些历史数据对每个仓库是如何规划箱子进行新的分析,这只是一个新的问题,我们明确提出了一个新的问题。

历史上传统学术界从来没有做过,因为现在电子商务积累了那么多商品数据和订单数据,我告诉每个仓库,它发货的时候,用户都讨厌一起卖东西。然后,产品的成分按顺序是什么,它们的长方形低是什么,一个是在生产,一个是在生产。

我从数据的角度告诉你反向销售可以拟合出什么形状的盒子,然后我们就这么做了,这也是一个很有意思的问题。刚才我说假设我的等价盒矩形低,我愿意解决这个问题,只是一个很没用的问题。

这里我们显然不需要使用传统优化算法中的梯度,而是使用梯度上升法,因为你显然搞不清楚它的梯度是什么,所以我们做了一些无梯度算法。因为这个问题是相似的,对这个盒子的矩形低没有太多的约束,所以可以做一些没有梯度的优化算法,重复每个盒子的矩形低的参数空间,然后看看最终总成本的函数有多大,然后在不平衡全局搜索和局部搜索的情况下找到一个拟合解,这样会大大节省成本。这是对我们的救赎。

在物流行业,你做了一个很好的算法,但对你来说,找到你能超越的约束大概更重要。我们进一步研究这个问题,因为传统的优化方法是运筹学中的一些方法,如整数规划或一些启发式算法。

但是现在人工智能、深度自学、机器学习都是很热门的领域,确实有一些新的思路可以用在传统的问题上。 例如,在机器翻译领域,我们以前使用过一些传统的机器学习方法。

后来,有人明确提出用深度神经网络方法和LSTM网络结构来实现机器翻译。后来,关于如何利用这种LSTM网络结构来解决TSP问题,出现了一些学术言论,于是我们尝试利用这种网络结构来解决箱式转诊问题。这里的目标是说,我们需要预测货物放进去的时候订单是什么,让最终的面积大于那个,这确实是我们需要解决的问题。

传统的优化方法是时不时地寻找一个序列。用机器学习或者深度自学的方法,我需要预测那个顺序。

当然,不会涉及很多数据,也不会用到历史数据。这里的输出数据是文章的矩形low,输入数据是它的order数据。

中间的一些模型与机器翻译的模型网络结构非常相似。当然,我们做的时候也是用它的历史数据来训练,可以提高5%。虽然这个生物技术优化还是一个比较老的领域,但是在人工智能时代,机器学习和深度自学的算法确实是可以用的。

车辆路径规划是物流行业中最重要的问题。这个问题的定义只有很简单,就是我们有一些必须在地理上服务的点,这些点被存储或者必须收集的货物所覆盖。它在地理上是异地生产的,我必须从一个总中心取前几辆车,分别领取,或者分别配送这些商品或者罩子。

这个问题体现在两个层面:一是如何发工作,哪些服务点应该给哪些车,先用。第二,每辆车怎么走,怎么优化它的路线,类似于仓库提货的优化路线。

这些问题就是车辆路径规划问题。它有很多变种,比如CVRP,就是有些车是限量的,轻的。还有VRPTW,就是有时间窗约束。而VRPPD,你去一个地方拿东西,然后去另一个地方存放。

还有一些其他人的群体,所以问题只是很多,但大体框架和那个差不多。无非是说想带几辆车去几个服务点,然后怎么到每辆车。

这个问题数学上很抽象,很清楚。传统的方法有两种:一是有一些精确解,这些算法在服务点多达100个的情况下,一般很难在优先时间内求解;其次,传统算法中有很多近似算法,如ALNS和VNS,都是针对分水岭搜索的算法和遗传算法。

现在一些前沿的研究是如何把这些优化算法和一些深度自学的技巧结合起来。我们为车辆路线规划开发了一个非常强大的引擎。如前所述,这是物流行业普遍存在的问题。从算法的角度来说,最重要的一点是在机器学习中使用一种思想。

我想优化的每一个问题都不会有不同的约束。比如在农村,约束车的数量是不变的,商店可能有时间窗。所以每一类问题的约束都是多种多样的。如果我单独做一个算法,我会让它做,但是如果我想让算法适应环境中不同的约束,那就很无奈了。

而且我们告诉大家,在机器学习和增强自学中不会出现一些自适应的方法。我们不会根据这个问题的相似结构来确定如何解决这个问题。这里用的是比较传统的匪学思想,各种问题不会有不同的解决方案。还有一些运营商。

我会试一试。如果我想到每两个交换一次,每三个交换一次,我能不能把这个解决方案做得更好,把一些解决方案变成一个转化? 不同的问题,不同的策略不会让它变得更慢,所以我们去中局。

比如这次不错,但是下次就不尝试其他方法了。比如两两之间交换差,我可以试着三个一个的交换。

这样,每个个体都不会去寻找特定的操作者。什么样的算子和算法适合?我们的应用有很多案例,比如一些生鲜仓储的应用,农村淘宝,城市店铺仓储,仓库选择路径优化。它可以用在很多场景中,同样的算法引擎也可以用在很多场景中,因为它有一个自适应的自学习过程。

在大数据智能订购下分享我们的大数据智能订购。传统物流的情况是必须按照全国的流向来收包分。

比如我就按照以前人分的北京上海广州的流向来分。如下图,有一个人在看租赁地址,然后放在对应的端口。全国可能有200多人,手工服务公司很难合作。

在未来,我们同意我们期待自动化。自动化最重要的一点是数据。首先,我们必须数字化这个地址,然后对其进行编码。

以前是写代码的工会,我会看这个地址。目前新手电子脸单由商家发货,不会写相应的代码,操作人员只需要看这个代码,非常方便,因为识别一个字节比手写地址简单多了。一个地址应该去哪个站点仓储?一家快递公司要分多少条规矩?比如深圳福田区的一家分店,服务于哪个区域?它有一些非常简单的规则。你很难把这些规则数字化。

我们用了什么样的方法?我们使用大规模的机器学习方法。我不告诉你规则是什么,也不用描述。我把它们挖出来。

热电竞竞猜

这是机器学习的一个非常简单的应用。我没告诉你你是怎么自学的。只要我有历史数据,我就可以通过挖掘机器学习来使用它们。

不会有分词、地理栅栏特征和规则特征。我们用大数据模型自学,最后把订单和他们对应的点分开。据了解,中国有很多物流提供商,很多快递公司,很多仓储公司,每个公司在自己的区域都有不同的优势。如上图,左边的公司和右边的公司存储时间是有区别的。

可以看出,比如在北方,右边的公司不如左边的公司。商家想发货的时候,必须对每一条线进行自由选择。比如商家在杭州,谁一定放在杭州到上海,谁会放在杭州到广州,北京,武汉,下面还有很多仓储公司。

这是一个种群优化的问题。我如何为每一行分配我的订单以及哪种材料?这个东西,用人很万能,很简单,很离谱。会像每一行怎么划分一样粗,如果交给算法就不会很细了。我们做了一个引擎,考虑了时效性,服务,成本等。

一起评估了所有因素,想要一个合适的配送方案,然后自动为该商户获得智能配送解决方案。刚才提到了很多算法。我们是一家以技术为核心的互联网公司。

我们希望通过整合社会物流来提高中国的物流水平。积累的技术需要对外开放,需要全社会的物流公司使用,整个中国社会的物流水平需要提高。比如路径规划算法的引擎,我们已经和很多伙伴联系上了,刚才提到的盒子推荐算法已经对外开放了。

还有地址数据库,地址如何分类,地址的单一服务,标准化服务,不能拆分订单的算法。我们对所有物流合作伙伴都是对外开放的。这样才能提高中国物流的效率。

未来的发展方向从技术角度来看,我们未来的发展方向如下:第一点是指模型驱动的方法到数据驱动的方法。如前所述,传统的物流优化一般采用生物技术优化的模型,生物技术优化一般没有成本等目标函数。然后我就有约束条件,比如当天的订单比例是多少,这个仓库有多少订单达不到,这个车有多少东西达不到。

列出这些约束后,必须解决它们。这是一种以模型为中心的解决问题的方法。然而,互联网时代积累了许多数据问题。

有可能我们已经解决了很多问题。他们有点不一样,但是有很多地方是一样的。比如农村仓储,我每天需要仓储的村子只会倒过来,但是数量会变。所以我昨天解决的路径规划和我今天解决的路径规划应该有相当大的相关性,但是传统的模型驱动的方法,我破坏了这种相关性,我昨天的解决方案是没有用的。

在我把一类问题在某种程度上解决了几次之后,我应该可以总结出有一些方法,对于明天解决一定程度的问题或者类似的问题是没有帮助的。这就是用数据驱动的方法解决问题。

我们也用一些深度自学或者机器学习的方法来做这方面的研究,确实是一个非常令人兴奋的方向,它真的是通过一些新的活力流过了传统的领域。第二类是算法必须产品化。算法可以做得浅一些,不用考虑各种下脚料的情况,尤其是物流行业。

我想应用到实践中去,很多环节一定要大大打磨。就像刚才提到的路径规划算法,我们在运算过程中得到很多对系统,不会再把那些对系统加回去。当我们将算法平台化时,我们将为一个单独的问题解决一个算法。因为问题太多,单独对每个问题建模,在可扩展性上不会遇到相当大的问题。

刚才我也提到了大部分算法已经对外开放了,所以我不想将来把我们的算法能力和我们的人工智能能力对外开放来提高物流行业的智能。允许禁止发表的原创文章。以下是发布通知。。

本文来源:热电竞lol竞猜首页-www.amarifoods.com

0314-527082950

联系我们

Copyright © 2010-2014 北京市热电竞科技股份有限公司 版权所有  京ICP备75257589号-6