回到顶部

DigitalOcean 开发者沙龙:AI 模型的性能与成本优化专场

2025年6月7日 14:00 ~ 2025年6月7日 17:00
活动票种
  • 免费

    • 免费票
 免费票
订票数量
- +
付费活动,请选择票种

活动内容收起


DigitalOCean 首度开启中国区技术沙龙,欢迎DigitalOcean的老用户来与我们交流。



活动亮点

亮点1:大模型训练的存储成本优化           

大模型训练中,涉及到大量数据的成本,这部分的成本不容忽视。JuiceFS将分享通过对象存储的分部署文件系统,打造一个高效且经济的存储解决方案。

               

亮点2:推理场景下的成本和性能优化

通过RAG优化,降低GPU的调用量,是最直接的降低推理成本的方式。商汤和NebulaGraph将分享RAG优化解决方案,提高推理性能,降低推理成本

                          

亮点3:GPU的选型和架构设计

AI训练和推理,GPU资源是必不可少的。GPU如何选,架构上如何设计,以便于降低成本、提高容错且考虑到未来迁移。


通过参与此次活动,你将获取选卡、架构设计、性能优化、成本优化多方面的解决方案。

               

活动流程



14:00-14:40

JuiceFS在大规模 AI 场景中遇到的存储挑战与实践经验

苏锐,Juicedata 合伙人


AI 业务涉及大量非结构化数据,包括文本、图像和视频等格式,同时企业还必须应对数据量的急剧增长。在这样的背景下,分布式文件系统成为 AI 时代数据存储的一项关键技术。相比传统的全闪和内核并行文件系统,JuiceFS 作为一款基于对象存储的分布式文件系统,提供了一个既经济又高效的云上存储解决方案,并已经被应用在多个AI场景,如大模型、自动驾驶等。


在本次活动将分享我们在大规模 AI 场景中遇到的存储挑战与实践经验。


大纲

性能:AI 训练中,如何为 GPU 提供充足的吞吐?

成本:面对指数级增长的数据量,如何平衡存储成本与性能?

多云:如何应对多云架构中,数据同步、一致性等复杂的运维挑战?

前沿场景案例分享 

自动驾驶

大模型研发


14:40-15:20 

议题:企业级RAG性能优化实践

王志宏,商汤科技大装置事业群研发总监


内容简介:

到目前为止,RAG依然是当下最落地的大模型技术(没有之一),但很多企业面临RAG效果差或者性能不佳的问题。在本次活动中,我们将分享:

1. 通用RAG的流程解析

2. 冷启动加速

3. 召回模块加速

4. 生成模块加速


15:20-16:00 

构建图和视频生成式大模型最快的推理框架

成泽毅,WaveSpeedAI 创始人


16:00-16:40 

NebulaGraph: 如何使用 GraphRAG 构建企业级知识库

邵晓凌 NebulaGraph GenAI 解决方案架构师


1. 大模型企业化应用的核心挑战

剖析行业痛点:数据隐私性、领域知识适配性、计算资源成本、推理实时性等关键瓶颈,企业级需求与传统通用大模型的能力鸿沟。


2. 通用RAG技术体系解析

技术定义:检索增强生成(Retrieval-Augmented Generation)的架构范式与核心价值

实现路径:文档切片、向量检索、生成优化的全链路技术方案


3. Graph RAG的技术突破性优势

知识结构化:基于图数据库的实体关系建模实现深层语义关联

动态推理能力:通过图遍历实现多跳逻辑推理与上下文扩展

对比实验:与传统向量检索方案在复杂查询场景下的性能差异


4. NebulaGraph AI平台的GraphRAG 融合创新实践

技术集成架构:混合检索策略(向量+图+关键词)的协同优化

企业级解决方案:

✓ 私有化知识图谱构建

✓ 细粒度访问控制机制

✓ 领域自适应微调管道


16:40-17:20 

从选型到架构,如何构建 AI 训练和推理提供AI算力资源

Derek Ding,DigitalOcean Cloud Solutions Expert,卓普云科技解决方案架构师


越来越多的企业开始开展自己的AI业务,但是很多企业面临这样的问题:如何进行选型,架构上如何设计,如何降低成本?在本次活动,我们将分享:


架构对比:算力、显存、互联带宽

性价比分析:训练/推理成本、能耗比

适用场景:LLM训练、推理部署、多卡扩展


演讲嘉宾:丁可, DigitalOcean Cloud Solutions Expert,卓普云科技解决方案架构师







               

活动嘉宾


Derek头像.jpg

丁 可

DigitalOcean Cloud Solutions Expert

卓普云科技解决方案架构师

云计算与数据分析领域从业18年,先后供职于Digital Ocean中国、Neo4j图数据、亚马逊AWS和甲骨文数据库等公司担任架构师与技术咨询和实施顾问。关注新兴人工智能技术与当前IT服务的结合和重构,人工智能的工程化与落地等领域。人工智能与数据和计算的结合。对开源社区与AIGC有着浓厚的兴趣与参与。AWS认证DevOps专家/解决方案专家/数据专家,Neo4j图数据科学专家。

               

screenshot-20250507-144528.png

 苏锐

Juicedata 合伙人

Juicedata 合伙人,作为 1 号成员参与创建 JuiceFS,一直深度参与在开源社区中支持开发者使用 JuiceFS。


screenshot-20250506-091830.png

 成泽毅

WaveSpeedAI 创始人

创始人成泽毅是stable-fast、ParaAttention、Comfy-WaveSpeed等多个行业明星开源项目作者,多次实现行业SOTA性能突破。创立WaveSpeedAI前,成泽毅曾在硅谷知名AI基础设施公司担任推理引擎负责人,推动公司图像生成业务推理性能提升10倍,成为支撑公司商业爆发的关键技术力量。

在成泽毅的带领下,WaveSpeedAI对标硅谷一线AI Infra公司,已在多模态生成领域取得技术领先优势。


screenshot-20250512-155224.png

 邵晓凌

GenAI 解决方案架构师|NebulaGraph 

NebulaGraph 图技术解决方案专家,曾就职于谷歌、福特等世界500强的技术管理岗。复旦计算机硕士,10+ 技术专利持有者。现在 NebulaGraph 主导设计 Graph+LLM 融合架构,推动 GraphRAG在企业级知识库应用落地中实践检索。


screenshot-20250512-155615.png

 王志宏


商汤科技大装置事业群研发总监


曾担任商汤自研的深度学习框架 SenseParrots 的研发负责人;目前负责探索大模型应用的商业落地,并主导多 Agent 大模型应用开发工具链 LazyLLM社区版及企业版的研发工作。



购票须知

1.报名方式:点击下方【立即报名】                

2.报名须知:凭活动行【电子票】验票签到入场       

3.参会均可获得DigitalOcean开发者周边大礼包:双肩包、棒球帽、T恤、笔记本

               


扫码加微信群

screenshot-20250512-171326.png





举报活动

活动标签

AI

最近参与

  • Jeff
    报名

    (32分钟前)

  • 芳哥
    报名

    (2小时前)

  • LEO
    报名

    (3小时前)

  • 京熙
    报名

    (3小时前)

  • shine豆豆
    报名

    (3小时前)

  • 小熊 3
    报名

    (4小时前)

报名须知

1、本活动具体服务及内容由主办方【卓普云科技】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。

2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。

您还可能感兴趣

您有任何问题,在这里提问!

为营造良好网络环境,评价信息将在审核通过后显示,请规范用语。

全部讨论

还木有人评论,赶快抢个沙发!

活动主办方更多

卓普云科技

卓普云科技

DigitalOcean云服务,简单易用,超低成本。与DigitalOcean一起开发,幸福生活到永远

微信扫一扫

分享此活动到朋友圈

活动日历   05月
28 29 30 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1

免费发布