20251017 《现代软件工程》课程个人博客作业 1——就《现代软件工程》提 5 个问题

Part B｜快速通读《构建之法》后的五个问题
说明：每个问题均包含“问题陈述｜触发出处｜我们查的资料(显然,这里有LLM辅助写作)｜LLM提出并建议我实践的计划｜未解之惑/待验证”，并尽量给出可复用的评估维度或实验设计思路。

Q1｜在快速迭代的项目中，如何平衡“敏捷性”与“关键决策的持久记录”？

问题陈述
创业项目或课程实践常追求极高的迭代速度（敏捷性），但这种速度往往是以牺牲文档为代价的。当核心成员离职或项目进入维护期，关键的架构、技术选型等决策依据会丢失，形成“认知债务”。如何设计一个轻量级的流程，确保在不降低迭代速度的前提下，关键的架构决策记录（ADR）能够被及时沉淀和追踪？

触发出处
第 5、11、16 章关于团队合作、设计原则和文档管理的讨论。

我们查的资料

ADR（Architectural Decision Records）：一种轻量级文档模式，记录重要的架构决策、背景、可选方案及后果。

C4 Model：一种用于可视化软件架构的多层模型（Context, Containers, Components, Code），帮助团队快速达成对系统整体的理解。

Decision Log (Spotify)：Spotify 等公司使用决策日志作为轻量级知识管理的核心实践，强调决策的可追溯性。

LLM提出并建议我实践的计划
以**“异步协作”与“工具强制”**为核心：

触发机制：只记录影响超过一个模块或涉及非功能性需求的决策。在每次 Issue/PR 模板中内置“是否需要ADR？”的复选框，强制开发者思考。

工具集成：使用如 adr-tool 或集成到版本库的 Markdown 文件，强制在 PR 合并前，由 Navigator 或 Code Reviewer 确认 ADR 的存在和关联。

评估维度：通过计算“关键文件（如配置、接口定义）变更后，对应 ADR 的更新率”来度量实践效果。

未解之惑/待验证
ADR 的“关键”程度难以客观量化，可能导致过度记录或漏记。是否存在一个可量化的指标（如：变更涉及的代码文件数量、功能点的复杂度）作为“必须记录ADR”的自动触发阈值？

Q2｜如何用组织和心理学机制，防止“破窗效应”演变为工程质量灾难？

问题陈述
软件中的“破窗效应”指忽略微小的错误（如代码风格不一致、警告未处理、测试用例不足）最终会导致团队对质量标准的普遍放任，积累巨大的技术债。如何从团队流程和工程师心理机制入手，建立一种“零容忍”文化，使得团队主动且持续地维护代码的整洁度？

触发出处
第 1、12、17 章关于软件质量、测试与绩效管理的讨论。

我们查的资料

“持续集成（CI）的文化”：强调小步快跑、频繁合并，使错误暴露成本最低。

Code Review（代码评审）中的“标准执行”：将风格和简单缺陷的检查交给 Linting/静态分析工具，让人力专注于逻辑和设计缺陷。

责任感与“所有权”：通过明确代码模块负责人，利用个体的责任感来维护其所负责区域的质量。

LLM提出并建议我实践的计划（可量化指标与流程）

工具强制：将代码静态分析（Linter/Formatter）集成到 CI 流程中，失败即拒绝合并（Merge Blocking），使“破窗”在第一时间被物理阻断。

团队共识：每周固定在站会（Stand-up）或回顾会（Retrospective）中，用 5 分钟回顾上周被发现重复出现的 Linter 警告或静态分析问题，并将其纳入技术债清单，明确处理时间。

评估维度：“警告逃逸率”（静态分析警告数量与实际合并进入主分支的 PR 数量之比）和**“热点文件缺陷密度”**（高变更频率文件的缺陷报告数量）作为质量前置指标。

未解之惑/待验证
工具强制是否会导致团队的“工具疲劳”或“逆向优化”？如何设计一个机制，允许团队在紧急情况下“临时绕过”CI 流程，但同时确保事后必须进行弥补？

Q3｜自组织团队如何高效管理并解决重大的、深层次的技术分歧？

问题陈述
在《构建之法》倡导的自组织、平等合作的团队模式中，当团队成员在核心技术栈（如语言、框架）或宏观架构方向上存在根本性分歧时，如何避免陷入无休止的争论或因意见不合而导致效率停滞？缺乏“独裁者”的情况下，如何保证决策的及时性、质量和团队的士气？

触发出处
第 4、5 章关于两人合作和团队组织、以及第 11 章的设计原则。

我们查的资料

T-Shirt Sizing：用“小号、中号、大号”等相对单位进行评估，避免陷入精确数字的争执。

“技术探索”与“原型竞争”：将分歧转化为短期、可控的实践（Spike），让不同方案在原型中竞争，用证据而非观点说话。

仲裁机制：设定一个临时的、具有最终决定权的“技术仲裁者”（可以是团队外的资深人士或项目经理），仅在团队僵持不下时启用。

LLM提出并建议我实践的计划（“证据驱动”的冲突解决流程）

界定分歧：将分歧转化为可验证的非功能性需求指标（如：方案 A 带来 50
ms 的延迟，方案 B 带来 10
ms 的内存占用）。

原型竞争：分两组进行短期（不超过 3 天）的“原型竞赛”，分别实现关键瓶颈模块，并用统一的基准测试进行评估。

决策标准：以数据证据和 ADR 记录为依据，进行投票（如果数据证据不足，则倾向于风险最低/可维护性最高的方案）。

评估维度：通过追踪“技术分歧引入的 ADR 数量”与“分歧从提出到解决的中位时长”来度量团队的冲突解决效率。

未解之惑/待验证
当原型竞争的时间成本高于直接实施任一方案时，这种方法是否仍具经济性？如何防止仲裁者权力固化，避免团队再次退化为“独裁者/执行者”模式？

Q4｜在“捣蛋鬼”用户场景下，如何系统化地分配防御性工程资源？

问题陈述
当面对恶意用户（如黑客、作弊者、滥用 API 者）时，团队必须投入资源进行防御性开发。这种投入会直接挤占为合法用户开发新功能（功能性需求）的资源。如何在资源有限的前提下，建立一套伦理与资源分配框架，系统地决定防御性工程（如安全、反作弊、风控）的“度”？

触发出处
第 8、10 章关于需求分析和用户建模，也间接呼应了另一个同学关于高数考试平台作弊防御的困境。

我们查的资料

STRIDE 模型：用于威胁建模的框架，分析潜在的安全威胁（Spoofing, Tampering, Repudiation, Information Disclosure, Denial of Service, Elevation of Privilege）。

资产重要性评估：对系统中的数据、功能进行价值和敏感度分级，优先保护高价值资产。

风险价值期望：Risk=Probability×Impact，用于量化风险，指导资源投入。

LLM提出并建议我实践的计划（风险驱动的资源分配）

资产与威胁映射：列出核心系统资产（如用户数据、核心算法、计算资源）并用 STRIDE 进行威胁建模。

风险分级：评估威胁的发生概率和损失影响，计算风险得分，得出高风险清单。

防御成本核算：对防御高风险清单中项目的成本（工时、资源）进行估算。

资源分配公式：设定一个固定的资源比例（如 80% 用于新功能，20% 用于防御性工程），然后将防御性工程的资源优先投入到风险得分最高的项目。当防御成本超过分配比例时，必须发起 ADR 讨论，以“接受风险”或“削减功能”来解决。

评估维度：追踪**“成功防御次数”与“因防御措施导致的用户体验受损（例如额外点击、等待时间）的度量”**，确保安全性的提升未过度牺牲可用性。

未解之惑/待验证
恶意用户的动机和能力难以准确预测，“发生概率”的估计带有高度主观性。是否存在一种方法，将“防御性工程”视为一种可测量的非功能性需求，并为其设定一个明确的性能指标（例如：每年被成功攻击的次数必须低于 X）？

Q5｜如何量化代码中的“偶发复杂性”，并说服利益相关者进行大规模重构？

问题陈述
代码是为人而非机器编写的（SICP）。在实践中，许多代码并非是业务逻辑（本质复杂性）的需要，而是因设计失误、技术债、或不恰当的模式引入的偶发复杂性（Accidental Complexity）。这种复杂性最终表现为维护成本高、缺陷率高。除了主观感受外，有哪些可量化、可追踪的指标能证明“系统已达到必须重构的临界点”，并以此说服不理解技术细节的业务或项目管理层？

触发出处
第 1、13 章关于软件工程的本质和软件维护。

我们查的资料

代码度量（Code Metrics）：如圈复杂度（Cyclomatic Complexity）、内聚度（Cohesion）和耦合度（Coupling）。

变更半衰期（Change Half-Life）：一个代码模块的改动导致新缺陷的频率和时间。

Feynman Problem-Solving Algorithm：将问题写下、思考、然后验证，在软件工程中可映射为“理解成本”。

LLM提出并建议我实践的计划（临界点量化与成本效益分析）

临界点指标：

高复杂度文件逃逸率：追踪圈复杂度超过 N 的文件，其引入的缺陷逃逸到生产环境的比率。

变更影响范围：单次小需求变更（如修改一个字段）所触及的文件数量中位数。

“理解时间”：要求新入职或新接手该模块的工程师记录其“首次有效修改”所需的学习/阅读时间。

成本效益论证：将重构的成本（工时）与重构后预期的收益（如：缺陷修复时间 MTTR 下降 X%、新功能开发效率提升 Y%）进行对比。

评估维度：重构后，跟踪缺陷密度（每千行代码的缺陷数）和**变更前置时间（LT）**的实际变化，用以验证重构的投资回报率（ROI）。

未解之惑/待验证
圈复杂度等指标容易被代码风格或语言特性操纵。是否存在一个更通用的、与业务逻辑关联的“逻辑理解成本”指标，能够排除技术实现的干扰，更真实地反映偶发复杂性？

20251017 《现代软件工程》课程 个人博客作业 1——就《现代软件工程》提 5 个问题

Q1｜在快速迭代的项目中，如何平衡“敏捷性”与“关键决策的持久记录”？

Q2｜如何用组织和心理学机制，防止“破窗效应”演变为工程质量灾难？

Q3｜自组织团队如何高效管理并解决重大的、深层次的技术分歧？

Q4｜在“捣蛋鬼”用户场景下，如何系统化地分配防御性工程资源？

Q5｜如何量化代码中的“偶发复杂性”，并说服利益相关者进行大规模重构？

20251017 《现代软件工程》课程个人博客作业 1——就《现代软件工程》提 5 个问题