跳转至

我的博客

NiceGUI更新日志

日期 版本号 新特性 BUG修复
20250602 2.19.0 1.针对现代浏览器,通过跳过ES模块提升页面加载速度;
2.通过延缓非重要的 JS 提升页面加载速度;
3.完善 ui.aggrid 完全配置(getterssettersfrom_pandasfrom_polars);
4.如果 ui.download.from_url 是基于绝对路径 URL(可能引起问题) 被调用,则会发出警告提示
1.允许覆盖 PyWebview 的 storage_pathprivate_mode
2.修复 ui.markdown 的语法突出显示,包括 codehilite.css 更稳定

国内使用UV的代理设置

原文地址:https://www.yangyanxing.com/article/uv-proxy-setting

1. 安装第三方包时的镜像设置

在使用 uv add 命令安装第三方包时,有两种方法可以设置国内加速镜像:

1.1 命令行中指定镜像

使用 --index 或者 --default-index 参数指定镜像地址,例如:

1
2
3
uv add fastapi --index https://mirrors.aliyun.com/pypi/simple/

uv add fastapi --default-index https://mirrors.aliyun.com/pypi/simple/

简单说明下两者的区别:

参数 环境变量 描述
--index UV_INDEX 可以设置多个索引源,多个索引源之间以空格分开,适用于同时使用多个索引源
--default-index UV_DEFAULT_INDEX 只设置一个索引源,用于替换默认的 PyPI 源

一般情况下,我们只需配置 UV_DEFAULT_INDEX 即可,常用的镜像源有:

1.2 设置环境变量

可以在 .bashrc 文件中添加环境变量 UV_INDEXUV_DEFAULT_INDEX,然后执行 source .bashrc 使其生效。

2. 安装 Python 时的镜像设置

UV 提供了通过 GitHub Releases 下载 Python 的功能,可以通过以下 --mirror--pypy-mirror 两个参数和环境变量来设置镜像:

  • --mirror: 用于设置 CPython 的安装包镜像,可以通过设置环境变量 UV_PYTHON_INSTALL_MIRROR 来指定下载镜像。
  • --pypy-mirror: 用于设置 PyPy 的安装包镜像,可以通过设置环境变量 UV_PYPY_INSTALL_MIRROR 来指定下载镜像。
维度 CPython PyPy
实现语言 C 语言编写,官方标准解释器 RPython 编写,基于 JIT 编译技术
性能表现 解释执行字节码,性能较低 JIT 编译热点代码为机器码,性能提升 3-4 倍
内存管理 引用计数 + GIL,存在内存碎片问题 增量垃圾回收 + 分代回收,无 GIL 限制
并发支持 单线程并发(GIL 限制多线程性能) 支持微线程(Stackless 模型),适合高并发场景
生态系统兼容性 完整支持所有 Python 库 兼容大部分纯 Python 库,对 C 扩展库支持有限
典型应用场景 Web 服务、自动化脚本、科学计算 数值计算、长时间运行的服务、高并发 API 服务器
启动时间 快速启动 需 JIT 预热期

目前国内还没有一个完全同步的下载镜像,所以使用 uv python install 下载非常慢,南京大学的镜像站提供了 UV 的最新下载:https://mirror.nju.edu.cn/github-release/indygreg/python-build-standalone

3. 总结

  • UV_PYTHON_INSTALL_MIRROR:用于设置使用 uv python install 命令下载安装 Python 时的镜像。
  • UV_DEFAULT_INDEX:用于设置使用 uv add 命令安装第三方包时的镜像。
  • UV_INDEX:用于设置额外的安装镜像,如公司内部的包索引地址。

建议:如果你的网络环境可以正常访问 GitHub,则无需设置镜像。如果访问不了,可以设置南京大学的下载镜像,并配置 UV_DEFAULT_INDEX 为阿里源或清华源来加速 uv add(等同于 pip install)的安装过程。

通过合理设置镜像源,可以显著提升在国内使用 UV 进行软件包管理和 Python 安装的效率。

衡量用户研究的ROI

原文地址:https://mp.weixin.qq.com/s/HIXlWSJNMFf_z5mvGRT0ww

用户研究在驱动产品创新、提升用户体验和实现商业成功方面扮演着日益关键的角色。然而,长期以来,很多企业的用研团队都需要持续自证价值,这件事轻则影响能获得的调研资金预算,重则关乎整个用研团队的生死存亡。

本文旨在深入探讨衡量用户研究ROI的重要性、面临的挑战、核心框架与模型、具体计算方法、实施策略以及未来趋势。

评估指标差异对XGBoost特征筛选与模型性能排名的影响

原文地址:https://mp.weixin.qq.com/s/uySG1mER1vHitV-k7mSsSg

在机器学习中,特征选择是提高模型性能、减少计算复杂度和避免过拟合的关键步骤。而选择合适的特征选择方法,可以大大提升模型的准确性和训练效率。常见的特征选择方法有很多,这里介绍两种方法 前向特征选择递归特征消除(RFE)

前向特征选择和RFE的主要区别就在于它们如何进行特征排名和模型训练:

  • 前向特征选择会固定特征排名:在前向特征选择中,特征是按照某种标准进行预排序的。每次添加一个特征(排名最高),模型训练一次,并评估该特征对模型性能的影响。每个特征的排名是基于初始的预排序结果确定的,所以在整个过程中特征的排名不会动态变化。
  • 递归特征消除(RFE)是动态特征排名:与前向特征选择不同,RFE是动态的,每次删除一个特征后(排名最低),都会重新训练模型,并计算剩余特征的相对重要性。每次训练和删除都会影响特征的排名,因此每次训练后特征排名会发生变化。这使得RFE在筛选特征时的顺序是动态变化的,因此最后的特征选择结果会受到每次模型训练的影响,RFE也可以看作是后向特征筛选的一种实现形式。

实际上,前向特征选择和递归特征消除(RFE) 都与 特征排名 密切相关。无论是通过逐步添加特征,还是通过递归删除不重要的特征,它们的选择过程都依赖于特征的重要性排序。因此,特征的排名直接决定了哪些特征被选中,哪些特征被剔除。如果特征排名发生变化,最终的特征选择结果也会发生显著变化。特征排名的不同将会直接影响模型中保留的特征,进而影响模型的表现。

为了深入理解这种影响,本文将利用 XGBoost模型探讨不同评估指标下特征排名对特征筛选的影响。

逻辑回归 vs XGBoost

原文地址:https://mp.weixin.qq.com/s/uEMQXYs27MyZsN6-82-ccA

逻辑回归(Logistic Regression)和 XGBoost(eXtreme Gradient Boosting)是分类任务中广泛使用的两种机器学习模型,它们代表了机器学习中两种典型的思想:

  • 逻辑回归:简洁的线性模型,适合解释性强、计算开销小的场景;
  • XGBoost:复杂的集成模型,强调预测精度和模型能力,适合高维非线性任务。

我们将从模型结构、数学推导、损失函数、优化方法、泛化能力等等介绍。

Python安装Confluent Kafka库

参考文档:

1. Pip 安装

pip install confluent-kafka==1.9.2

注意

建议安装 confluent-kafka 1.9.2 版本,其他版本可能回出现公网发送消息报 SSL_HANDSHAKE 错误。此外,Centos 服务安装 confluent-kafka 更高版本时编译报错,无法正确安装。

2. Conda 安装

如果使用 pip 无法正确安装的情况下,可以试试 conda 安装,且该方式支持更高版本。

conda install conda-forge::python-confluent-kafka

信贷额度对风险的因果推断研究

原文地址:https://mp.weixin.qq.com/s/xL8j3z6QIdjQwMTW4UhibA

在信贷领域的因果推断研究中,传统方法多聚焦于二元处理变量(如是否发放营销优惠券)的因果效应估计。然而,当涉及贷款额度、利率等连续型处理变量时,传统二元处理变量的因果推断框架不再适用,需采用适用于连续处理变量的分析方法。

本文聚焦于贷款额度这一连续型处理变量的因果推断问题,采用公开的lendingclub的贷款数据集,结合Imbens《 The propensity score with continuous treatments》这篇文章中的广义倾向得分方法,对连续性处理变量的因果效应进行分析。