比赛推荐

约 2796 字大约 9 分钟

2026-03-16

长川科技企业命题-第九届中国研究生创“芯”大赛，中国研究生创新实践系列大赛管理平台

赛题四跨尺度芯片图像的裂纹缺陷智能检测算法设计

背景介绍：

在半导体制造与封装测试环节，芯片表面裂纹（Crack）是导致器件失效的关键缺陷之一，微裂纹引发的早期失效可能导致严重的安全事故。
裂纹的产生通常源于多物理场耦合应力，主要成因包括：

热应力失配（Thermal Mismatch）：芯片材料、基板与封装材料的热膨胀系数不一致，在回流焊或温度循环测试中产生剪切应力，导致界面开裂。

机械损伤（Mechanical Stress）：晶圆减薄、划片过程中的机械振动，或搬运过程中的微碰撞，易在芯片边缘或应力集中区产生微裂纹。

工艺缺陷（Process Defects）：金属层沉积不均、通孔填充空洞等前道工艺问题，在后道封装应力释放下扩展为宏观裂纹。

此外，随着芯片工艺制程的进步及封装形式的多样化，自动光学检测（AOI）设备面临的图像数据呈现出极端的尺度变化特征。一方面，不同检测机台、不同放大倍率下采集的芯片图像分辨率差异巨大；另一方面，裂纹缺陷本身的形态跨度极广，既存在肉眼难以察觉的微细裂纹，也存在贯穿芯片的宏观断裂，如图7所示：

图7 图像数据中多尺度缺陷示意图

传统的深度学习检测模型通常基于固定输入分辨率设计，难以同时兼顾极大分辨率图像中的微小目标检测与极小分辨率图像中的全局上下文理解。当图像分辨率跨度超过百倍、缺陷尺寸跨度超过千倍时，常规的特征金字塔或多尺度训练策略往往失效，导致微小裂纹漏检或宏观裂纹定位不准。
本题目基于真实场景下的极端尺度数据，要求参赛队伍设计具备强泛化能力的智能检测算法，能够同时解决“大图小缺陷”难发现、“小图大缺陷”难定位的行业痛点，提升芯片缺陷检测的准确率与鲁棒性。

描述及要求:

参赛队伍需设计并实现一个能够适应极端尺度变化的芯片裂纹检测算法，具体任务及要求如下：

1.核心任务

构建一个基于可工业落地的AI缺陷检测算法，输入为不同分辨率的芯片图像，输出为裂纹缺陷的位置信息（可选择性构建目标检测或者实例分割算法模型）。算法需在不针对单张图像单独调整超参数的前提下，实现对全尺度范围数据的有效检测。

2.数据尺度约束

算法必须能够处理以下极端尺寸范围的数据，且保证性能稳定：

a.图像尺寸范围（数据集全为单通道的灰度图样本）：

最小输入图像：59 × 46 像素
最大输入图像：7465 × 9263 像素
要求：设计的检测算法需兼顾不同的输入图像尺寸，例如设计有效的高效的图像分块或弹性缩放等策略。

b.缺陷尺寸范围：

最小缺陷尺寸：1 × 3 像素（微细裂纹）
最大缺陷尺寸：3947 × 3703 像素（宏观断裂）
要求：需解决极小目标特征消失及极大目标感受野不足的问题。

c.缺陷类型：仅针对 Crack（裂纹）类别进行检测。

3.功能与性能要求

a. 检测精度：

总体上需保持较高的检测精度
微小缺陷（目标宽度≤5像素或面积≤50像素²）上需保持较高的召回率
极大缺陷（目标面积≥300x300像素²）上需保持较高的定位精度
b. 检测跨度能力：模型应自适用于不同分辨率的输入（涵盖59 × 46至7465 × 9263尺度的图像样本）。
c. 推理效率：
对于常规尺寸图像（如≤2048×2048），单张推理耗时应<100ms。
对于超大尺寸图像（最大尺寸7465×9263），需设计合理的推理或加速机制，单张推理总耗时应 < 2s。

注：推理耗时包含预处理、模型前向传播、后处理全流程，但不包含数据加载时间，后续主办方会统一在英伟达4080显卡上统一校验推理速度。

d. 资源消耗：

显存/内存占用需合理，支持在主流 GPU 服务器环境下运行(训练推理时消耗总显存<16G)，鼓励进行模型轻量化设计。

评审得分点：

1.检测性能（40%）

极小缺陷检测能力（10%）：针对所有极小裂纹，召回率（Recall）是核心考核点。若漏检率高，此项得分大幅扣除。
极大缺陷定位精度（10%）：针对所有极大裂纹，考核平均边界框交并比（mean bbox IoU），要求边界贴合紧密。
综合精度（10%）：全测试集上的 mAP50排名（实例分割与目标检测均按照bbox mAP来计算）。
推理耗时（10%）：全测试集上的平均推理耗时。

2.技术方案创新性（30%）

跨尺度架构设计（15%）：是否提出了新颖的多尺度特征融合机制、动态分辨率策略、注意力机制或切片推理算法来解决尺度跨度问题。
小目标增强策略（10%）：针对极小缺陷，是否有特殊的损失函数设计、数据增强或超分辨率辅助手段。
算法复杂度优化（5%）：在保证精度的前提下，是否对计算量进行了有效优化。

3.代码完整性与工程化（20%）

代码规范与复用性（20%）：代码结构清晰（包含数据集前后处理、模型算法训练、样本推理及可视化等），接口定义明确，具备良好的代码编写风格。

4.设计报告与答辩（10%）

文档质量（5%）：技术报告逻辑严密，对极端尺度问题的分析深入，实验对比充分。
现场演示（5%）：视频或现场演示流畅，能够直观展示算法对大小尺寸图像的处理能力。

输出要求：

1.源代码包：

①需包含完整的数据预处理、模型训练、推理评估脚本。

②提供 requirements.txt 或 Dockerfile 以确保环境可复现。

③代码中需包含关键算法模块的注释。

2.模型权重文件：

提供在验证集上（自行划分）表现最佳的模型参数文件（如 .pth, .onnx 等）。

3.技术设计报告（Word、PDF 格式）：

包含方案架构图、解决跨尺度问题的核心思路、优化加速策略、实验数据对比、误差分析及结论。

4.测试结果文件：

按照组委会提供的格式模板，提交对测试集的预测结果以及每张测试集图片的耗时记录文件（JSON格式）以及测试结果推理生成脚本，需要使用2中的权重文件测试结果可以复现。

备注：组委会将提供包含上述尺度范围的数据集用于模型的训练与验证，测试集将于近期发放。参赛队伍需注意数据隐私，不得将数据集公开传播。

测试集将于近期上传至网盘链接。建议先行订阅下方分享链接，以便在数据更新后第一时间获取下载资源

https://pan.baidu.com/s/5pGfvMjw46fttXfPy_NQ5mA

2.第二十一届中国研究生电子设计竞赛（A类比赛）

“华为”企业命题预发布中国研究生创新实践系列大赛管理平台，其中赛题三、IAT：天线状态识别模型设计任务说明

（这个任务本质是一个数据清洗任务，只要从事深度学习相关的都可以参与，省事又容易，十分建议尝试一下）

一、任务概述

参赛选手需基于主办方提供的数据集与标签，完成以下任务：

设计具有物理合理性的输入特征；
构建用于天线状态识别的 N 分类模型；
在满足准确率与泛化能力要求的前提下，尽可能降低模型复杂度与推理计算开销；
输出可直接用于在线推理的分类模型及推理代码。

最终目标：在复杂、未知的用户接触条件下，实现快速、准确、低成本的天线最优状态选择。

二、问题类型

监督学习
N 分类问题

三、模型设计要求

（1）通用约束条件

模型类型不限，可自由选择，但需满足以下硬件部署条件：
① 模型需为静态前向推理模型（不建议动态结构或条件分支网络）；
② 禁止使用需要序列状态维护的模型（如在线 RNN 状态）；
③ 模型需支持单样本前向推理。

（2）允许使用的模型结构（但不限于）

① MLP（多层感知机）
② 轻量级 CNN / 1D-CNN
③ 树模型（如决策树、GBDT 的推理等价形式）
④ 其他可导出为静态推理图的模型结构

（3）不建议使用的模型与行为

① 依赖外部数据库或查表的大规模搜索模型；
② 推理阶段重新训练或更新参数；
③ 使用测试集信息进行模型设计或调参。

四、任务描述

输入：当前天线状态相关的一维特征向量（float32）

输出：最优天线状态编号（0 ~ N-1）

要求：模型需在未知使用者姿态、手握方式、头部靠近等场景下具备良好的泛化能力。

五、输出要求

提交格式与目录结构详见附录一《输出要求》。具体包括：

1.系统方案介绍 PPT

包含整体技术路线、模型架构、关键设计点等内容。

2.技术说明文档

需至少包含以下内容：

(1) 输入特征选择思路及物理意义说明；
(2) 模型结构设计与选择理由；
(3) 模型参数量、MACs、FLOPs 的估算方法与结果；
(4) 推理时间测试环境、测试方法与统计方式；
(5) 模型泛化能力提升的关键设计说明；
(6) 量化或模型压缩方案说明（如有）

（四）专家答疑邮箱
mailto:zhaoifan4@huawei.com

（五）茶思屋互动交流答疑社区
https://www.chaspark.com/#/races/competitions/1237842156721336320

数据集下载链接（1050k）：https://cpipc.acge.org.cn/sysFile/downFile.do?fileId=e935f5b2f4454e49947331e65d2bef91