5月26日凌晨4点30分,印尼最大科技独角兽GoTo集团总部的迁云作战室里,最后一条验证指令闪烁通过,标志着GoTo旗下即时配送和出行服务平台Gojek的业务系统已经全量迁移到了腾讯云上,比但出行高峰尚未到来,GoTo 集团CEO Patrick Walujo 还不敢掉以轻心。Patrick 的谨慎并非没有缘由:一方面,这场迁移关乎着GoTo筹划已久的降本提效战略能否成功;另一方面,这场的云迁移战役,由于其放之行业历史都首屈一指的复杂度,吸引着整个东南亚互联网行业的极大关注。
8点开始,Gojek App上的订单逐步起量,后台监控大屏上的负载数据也随之稳稳提升。最高峰的丝滑,才能宣告这场战役线点,Patrick 激动地宣布:
消息发布后,行业为之震动,不少同行私信祝贺Patrick和Goto。作为支撑这场“搬家”旅程的服务商,腾讯云也收到了东南亚一众企业的咨询和点赞。
里程碑之下,由 AWS、Azure 和 GCP 主导的东南亚云计算市场,也从此迎来新的变局。
的整合体的GoTo就诞生于此。2021年5月,GoTo由印尼两大独角兽企业——2010年成立的即时配送和出行服务平台 Gojek 和2009年成立的电商平台 Tokopedia 合并而成。这个覆盖出行、电商、金融服务的综合应用生态,
。但由于历史原因,这家主要用户群分布于印尼及东南亚的互联网企业,开展业务时却不得不面临着因
。Patrick对此难言满意。时间来到2024年。这一年,经过一系列业务重构,GoTo首次盈利。与此同时,一个旨在降低成本同时优化客户体验的技术升级计划,经过Patrick 决策成为了重点战略,CTO William Xiong则负责领导这个计划。
在William的规划中,技术升级最首当其冲的就是确保所有系统都位于印度尼西亚境内,以彰显公司对印尼数据主权承诺的支持。但他也清楚,搬家的困难摆在面前——7000公里、体量巨大、架构复杂、业务中断零容忍……
“这事有得做吗?”GoTo自己的技术团队甚至也对搬迁的可行性表达了疑虑。
很快,GoTo为这次迁移计划组织了一次全球招标。为了业务安全,GoTo选择了多云策略,即为ODS(Gojek等)、GTF(GoTo Financial等)、大数据三块业务寻求不同的合作方。多家全球知名的云供应商参与了这次投标,从去年开始大力拓展国际市场的腾讯云也在应标之列。
最终,在国内就以“搬家”能力强著称的腾讯云团队,通过展示过往成功案例,并经过服务匹配度、性价比、技术能力和交付能力等综合竞争,
。2024年五一假期后,腾讯云项目组正式进驻Gojek开启具体需求调研。
Gojek对现有供应商的依赖很大,广泛采用很多独有的产品特性,如果要实现最小化改动,腾讯云需要付出巨大的适配成本;
原以为是一个App的搬迁,调研完发现是打车、打摩的、外卖、快递、社区团购等7个App的搬迁,业务复杂度前所未有;
Gojek随着业务发展逐步累加了越来越多的功能,没有特别好地做过架构梳理,
。在方案设计上尽量保持Gojek现有使用习惯;无法兼容的场景则快速开发配套功能,如采用基于策略的安全组代替基于规则的安全组,并把这项工程视为腾讯云国际化战略的组成部分。
开展详尽的验证。最终确认,迁移将覆盖十余类 IaaS 产品,50多个产品模块及200多个功能点。随后的短短数月,腾讯云团队快速交付上线项
2024年9月,随着产品需求交付上线,Gojek工程平台适配工作同步启动。不同于其他项目,Gojek 的工程平台与开源的基础设施即代码(Infrastructure as Code,IaC)工具Terraform 深度集成,且架构与现有服务商高度耦合,简单编写模块代码已无法满足需求。同时,腾讯云团队还需要了解清楚Gojek平台如何与云产品集成,并从多云适配角度理解需求,用于指导代码的编写模式。通过线下紧密沟通合作,双方团队梳理了 Terraform 模块定制化需求的细节,整理了交付模块样本,经过与Gojek工程平台集成反复打磨之后,迅速进入了模块量产开发工作阶段。一个月内,腾讯云团队在开发代码的同时,也逐步向Gojek技术团队进行在线演示,进行产品的使用培训。最终,腾讯云完整地交付了全部 Terraform 模块并协助Gojek实现了集成对接,确保了PoC以及后续搬迁工作的顺利进行。
此外,为了降低腾讯云与现有服务商产品在使用差异方面给架构带来的影响,腾讯云团队最大化的将 Terraform 模块的使用与之前方式靠拢,通过模拟产品形态、整合产品功能用例等方式,为Gojek技术团队提供了使用上的连续性,保障了Gojek在多云环境下架构的一致性,也加速了其在腾讯云上的部署速度。
一方面,Gojek所需资源远超腾讯云印尼两个可用区的承载能力;另一方面,Gojek架构基于三可用区设计,贸然改为双可用区可能存在风险。
由于方案相对超前,Gojek团队甚至一度不能相信。但经过预生产环境 PoC 及正式环境演练后,该技术能力获得了Gojek团队的高度认可,并在最终生产环境中顺利实施。//一次“火箭发射”
但全量业务流量一夜之间割接到腾讯云,涉及平台所有用户,对海量数据的同步、业务之间大规模的协同配合、底层云基础设施对突发海量业务的支持性,都是历史级的考验。这好比一次“火箭发射”
5轮演练过程中,项目团队优化了割接步骤,解决了诸多演练过程中暴露的风险,同时也增进了不同团队之间的协同配合。经过演练,每个步骤、每个潜在风险以及对应的应急预案,都深刻印在了项目成员脑海里。
前期充分的准备,反而让大家异常平静。整个割接过程也非常顺利,仅仅用了4个小时就完成了数据增量同步校验、原环境全量业务停服、腾讯云全量业务开服、生产环境流量切换、业务验证等50多个大步骤、300多个小步骤。
(图:GoTo集团CEO Patrick Walujo 与CTO William Xiong接受采访)经此一役,在竞争日益激烈的东南亚市场,腾讯云也凭借卓越的技术实力、极致的性价比以及工程师团队的韧性与服务,打开国际化的一扇窗。
如果您有任何问题,请跟我们联系!
联系我们