AI技术博客 / 科研阅读记录 / 学习笔记

记录 AI技术 与科研思考

科研AI是一个关于人工智能技术的内容记录站,主要整理大模型、机器学习、深度学习、 计算机视觉、自然语言处理、多模态智能和科研方法相关内容。这里不强调服务功能, 更像一个长期更新的AI技术博客,用来沉淀阅读、学习、实验和思考。

人工智能 大语言模型 科研笔记 论文阅读
近期记录
大模型为什么能理解复杂指令? 从预训练、指令微调、上下文学习和对齐机制四个角度整理。
多模态AI的核心问题是什么? 记录图像、文本、语音等模态如何在统一语义空间中进行表示和交互。
科研论文应该如何拆解? 关注研究问题、方法设计、实验指标、消融实验和创新点表达。
AI技术学习如何避免只看概念? 建议结合代码复现、数据集实验、论文对比和问题驱动式学习。

AI技术文章

以博客文章的形式记录AI领域的重要概念、技术路线、研究趋势和实践经验。

大模型

从Transformer到大语言模型:理解生成式AI的基础结构

整理注意力机制、预训练任务、参数规模、上下文窗口和指令跟随能力之间的关系。

机器学习

监督学习、无监督学习与半监督学习有什么区别?

通过分类、聚类、伪标签和一致性约束等例子,梳理不同学习范式的适用场景。

计算机视觉

图像分类、目标检测、语义分割的任务边界

记录视觉任务的输入输出形式、常用数据集、评价指标以及典型模型发展脉络。

自然语言处理

NLP如何从词向量走向大模型时代?

从Word2Vec、RNN、BERT到GPT,记录语言模型在表示学习和生成能力上的变化。

多模态AI

视觉语言模型为什么重要?

围绕图文匹配、图像问答、跨模态检索和多模态推理,记录视觉语言模型的关键价值。

AI伦理

可信AI需要关注哪些问题?

整理模型偏见、数据隐私、可解释性、鲁棒性、安全边界和责任归属等基础问题。

AI专题索引

按照主题归档技术内容,方便后续持续补充和查阅。

机器学习

线性模型、树模型、集成学习、聚类、降维、模型评估与特征工程。

深度学习

神经网络、CNN、RNN、Transformer、优化器、损失函数与训练技巧。

大语言模型

预训练、指令微调、提示词、RAG、Agent、上下文学习与模型对齐。

计算机视觉

图像分类、目标检测、语义分割、实例分割、图像生成与医学影像。

自然语言处理

文本分类、序列标注、信息抽取、机器翻译、问答系统与文本生成。

多模态智能

图文对齐、视觉问答、跨模态检索、视频理解和多模态大模型。

科研方法

论文阅读、实验设计、消融实验、指标选择、结果分析与论文表达。

AI工具

记录常见AI工具、开源框架、模型部署、数据处理和代码实践经验。

科研笔记

这里记录阅读论文、理解模型、复现实验和整理知识时形成的长期笔记。

论文阅读方法

读一篇AI论文时,我会重点看什么?

一篇论文不只是看摘要和结论,更重要的是看它提出了什么问题、为什么这个问题值得研究、方法解决了哪一部分,以及实验是否真正支撑结论。

  • 先看研究问题和任务定义
  • 再看方法结构和关键假设
  • 重点检查对比实验和消融实验
  • 最后总结创新点、局限性和可延展方向
实验复现记录

AI实验为什么不能只看最终指标?

实验结果需要结合数据划分、训练策略、模型参数、损失函数、评价指标和随机种子一起分析。只看一个最终分数,很容易忽略方法是否稳定、是否公平以及是否具备泛化能力。

  • 记录数据集与预处理方式
  • 保留训练日志与模型配置
  • 比较不同模块带来的增益
  • 关注失败案例和边界场景

AI学习路线记录

按照从基础到实践的顺序,整理适合长期学习和查漏补缺的AI知识路径。

第一阶段:数学与编程基础

记录Python、线性代数、概率统计、微积分和数据结构中与AI学习密切相关的内容。

第二阶段:机器学习基本概念

整理回归、分类、聚类、过拟合、正则化、交叉验证和评价指标等核心知识点。

第三阶段:深度学习与框架实践

记录神经网络、卷积网络、Transformer、PyTorch训练流程和常见调试问题。

第四阶段:方向专题深入

围绕NLP、CV、多模态、大模型、医学AI等方向整理论文、代码和实验经验。

第五阶段:形成自己的研究问题

从阅读、复现和对比中发现问题,逐渐形成可验证、可实验、可表达的研究想法。

内容归档

本站内容以AI技术学习和科研阅读记录为主,后续可继续补充论文笔记、模型解读、 实验复现、工具使用、行业观察和个人思考。每一篇内容都尽量围绕一个明确问题展开, 不追求营销式介绍,只沉淀可反复阅读的技术记录。