个人简介

Table of Contents

返回

1 基本信息

EMAIL yangruipis@163.com
EEL +86 188 182 31378
GITHUB github.com/Yangruipis
HOMEPAGE https://yangruipis.github.io/
LOCATION Shanghai

2 教育经历

上海对外经贸大学 (2016.09 – 2019.03)
研究生(保研),数量经济学专业,金融数据挖掘方向
上海对外经贸大学 (2012.09 – 2016.06)
本科,统计学

3 荣誉和奖项

“东证期货杯”统计建模大赛(2018.03)
一等奖(top 10 in 1000+)
“华为杯”全国研究生数学建模大赛(2017.09)
二等奖(top 15%)
中国大数据创新行动大赛(2016.12)
一等奖(top 1,奖金5万元)
其他
上海市优秀毕业生、校十佳学术标兵、爱建企业奖学金一等奖(全校top10)

4 工作经历

4.1 [2021-07~] 上海天壤智能有限公司

  • 部门:金融大脑
  • 职位:研发工程师

项目:

  • 推荐系统
    • 内容推荐
    • 活动推荐
  • OCR
    • 模型平台
    • 容器平台
    • 数据生成平台

4.2 [2020-01~2021-07] 上海依图网络科技有限公司

  • 部门: 研究部
  • 职位: 算法工程师

项目:

  1. 人脸&人体归档项目(2019.01 – 2020.04)
    • 人脸&人体聚类算法维护和优化。在原有的二分图+层次聚类算法基础上引入新的策略(包括档案特征表示策略、多核心记录策略、去长尾策略等),同时完善了周边工具,包括 eval & visualize 工具、图片本地存储方案等。开发语言:C++。
    • 将 GNN(图神经网络) 应用到当前聚类流程中。完整参与了 前期算法设计、实验代码开发、实验设计和实操、标注迭代、算法性能优化、实验代码处理性能优化、算法集成和加速等 。模型1v1性能 Recall@Fa=1e-6 提升7~23个点,人体归档 Average Recall 最大提升20个点,上线后QPS@8GPU(2080Ti) > 10k。开发语言:C++(+ CUDA)、Python。
    • 2019年终绩效 3+(Research员工平均绩效为3)。
  2. CV 实验平台项目(2020.05 – 2020.07)
    • CV 实验平台开发。参与开发了一个以 torch 做后端,对多种 CV 任务(包括分类、检测等)通用的实验平台,并且支持 composite model 和 multi-task 训练。在其中负责 train、predict、eval、visualize、convert\_caffe 等基本功能的开发和维护,新算法添加和适配(比如SSD multi-label),以及部分算法(比如 nms)的加速。
    • 分布式训练调研,熟悉 Ray、horovod、pytorch DDP等分布式训练框架以及梯度同步算法。

5 简历源码

% !TEX TS-program = xelatex
% !TEX encoding = UTF-8 Unicode
% !Mode:: "TeX:UTF-8"

\documentclass{resume}
\usepackage{tabu}
\usepackage{graphicx}
\usepackage{multirow}
\usepackage{zh_CN-Adobefonts_external} % Simplified Chinese Support using external fonts (./fonts/zh_CN-Adobe/)
%\usepackage{zh_CN-Adobefonts_internal} % Simplified Chinese Support using system fonts
\usepackage{linespacing_fix} % disable extra space before next section
\usepackage{cite}

\begin{document}
\pagenumbering{gobble} % suppress displaying page number

\Large{
  \begin{tabu}{ l l l }
   \multirow{6}{1in}{\includegraphics[width=1in]{small_1}} & & \\
   & \ \ \scshape{\Huge{杨 睿}} &  \\
    & \ \ \email{yangruipis@163.com} & \ \  \rsssquare[cnblogs.com/yangruiGB2312]{http://www.cnblogs.com/yangruiGB2312/}\\
    & \ \ \phone{(+86) 188-1823-1378} & \ \ \github[github.com/Yangruipis]{https://github.com/Yangruipis} \\
    &  \multicolumn{2}{l}{ \ \ \home{\scshape{上海市-长宁区}}} &
  \end{tabu}
}

\ \ 



\section{\faGraduationCap\ 教育经历}
\datedsubsection{\textbf{\large{上海对外经贸大学}}}{2012.09 -- 2019.03}
\normalsize{\textit{研究生(保研)}\quad  \quad \quad \  数量经济学专业,金融数据挖掘方向} \hfill GPA:3.90,专业排名:4/17

\textit{本科} \quad \quad  \quad   \quad \quad  \quad \quad \quad 统计学 \hfill GPA:3.31,专业排名:2/54

\section{\trophy\ 荣誉和奖项}
\datedline{“东证期货杯”统计建模大赛 \quad \quad \ \  \quad \quad  \quad \   \textit{一等奖(top 10 in 1000+)} }{2018.03}
\datedline{“华为杯”全国研究生数学建模大赛 \quad  \quad \ \ \  \textit{二等奖(top 15\%)} }{2017.09}
\datedline{中国大数据创新行动大赛 \quad  \quad  \quad  \quad \quad  \quad \quad  \textit{一等奖(top\  1,奖金5万元)}}{2016.12}
\datedline{上海市优秀毕业生、校十佳学术标兵、爱建企业奖学金一等奖(全校top10)}{}


\section{\faUsers\ 工作经历}

\datedsubsection{\textbf{上海依图网络科技有限公司},\textit{研究部}, \textit{算法工程师}}{2019.01 -- 2020.07}
%*小组介绍:负责基于检测和识别模型的上层算法,包括\textbf{人脸/人体图像聚类(归档)
%\& 检索}算法,是公司安防算法落地的主要部门之一。
\textbf{\ [人脸\&人体归档项目] \  \hfill 2019.01 -- 2020.04}
\begin{itemize}
  \item 人脸\&人体聚类算法维护和优化。在原有的二分图+层次聚类算法基础上引入新的策略(包括档案特征表示策略、多核心记录策略、去长尾策略等),同时完善了周边工具,包括 \textit{eval \& visualize} 工具、图片本地存储方案等。开发语言:\textit{C++}。
  \item 将 GNN(图神经网络) 应用到当前聚类流程中。完整参与了\textbf{前期算法设计}、实验代码开发、实验设计和实操、标注迭代、\textbf{算法性能优化}、\textbf{实验代码处理性能优化、算法集成和加速}等。模型1v1性能 Recall@Fa=1e-6 提升7\textasciitilde23个点,人体归档 Average Recall 最大提升20个点,上线后QPS@8GPU(2080Ti) $\ge 10k$。开发语言:\textit{C++(+ CUDA)、Python}。
  \item 2019年终绩效 3+(Research员工平均绩效为3)。
\end{itemize}
\textbf{\ [CV 实验平台项目] \  \hfill 2020.05 -- 2020.07}
\begin{itemize}
  \item CV 实验平台开发。参与开发了一个以 \textit{torch} 做后端,对多种 CV 任务(包括分类、检测等)通用的实验平台,并且支持 \textit{composite model} 和 \textit{multi-task} 训练。在其中负责 \textit{train、predict、eval、visualize、convert\_caffe} 等基本功能的开发和维护,新算法添加和适配(比如SSD multi-label),以及部分算法(比如 nms)的加速。
  \item 分布式训练调研,熟悉 \textit{Ray、horovod、pytorch DDP}等分布式训练框架以及梯度同步算法。
\end{itemize}
% \datedsubsection{\textbf{上海天壤智能科技有限公司},\textit{金融大脑}, \textit{后端研发工程师}}{2019.07 -- }
% \textbf{\ [OCR训练平台] \  \hfill 2020.07 -- 2020.11}
% \begin{itemize}
%   \item 训练平台日常维护,算法模块镜像
% \end{itemize}

\section{\tasks\ 项目经历}

% \datedsubsection{\textbf{依图GNN图像聚类算法}}{2019.11 -- 2020.05}
% \begin{itemize}
% \item \textbf{算法设计}:参与了前期算法设计,给出性能评估方案(1v1单模块和端到端聚类性能)。
% \item \textbf{实验环境开发}:负责绝大部分\textit{pytorch} 实验代码开发和维护,并且后续不断对 training 和 inference 进行处理性能优化,方法包括了producer-consumer莫斯、稀疏矩阵、多卡处理、分卡IO优化等,熟练使用 nsight 进行 Profile。
% \item \textbf{C++集成与TensorRT优化}:负责部分GNN聚类集成环境设计(30\%)、大部分集成代码开发(70\%),以及所有torch转TensorRT优化的工作。在使用TRT过程中,借助邻接表对稀疏矩阵乘法进行进一步优化,避免了超大矩阵相乘。
% \item \textbf{其他数据和实验工作}:负责一部分数据集制作、算法实验设计和实操的工作,其中效果最好的knn阈值实验,使当时recall@FA性能提高3个点左右\%。
% \end{itemize}


\datedsubsection{\textbf{Kaggle Home Credit Default Risk}}{2018.06 -- 2018.08}
\begin{itemize}
\item 负责特征工程,包括了数据预处理,多表聚合,特征选择(\textit{Lasso、LightGBM、FeatureTools}),非平衡数据处理(\textit{ENN、Tomek}),模型的选择和优化(\textit{GridSearch、BayesOpt、LightGBM、XGBoost}),以及团队模型融合(\textit{Stacking、Weighted Average Rank})
\item 在7200+队伍中排名\textbf{137名},位于\textbf{前2\%}
\end{itemize}


\datedsubsection{\textbf{机器学习库\textit{simple\_ml}开发}}{2017.12 -- 2018.06}
\begin{itemize}
\item 个人项目\github[simple\_ml: \ https://yangruipis.github.io/simple\_ml]{https://yangruipis.github.io/simple_ml/} ,开发环境:\textit{python3.6+Anaconda+Emacs}
\item 仅依赖numpy实现了常用的特征工程、模型评价、分类(\textit{LR、KNN、NB、DT、SVM、SVR、BP、AdaBoost、GBDT、RF、stacking})与聚类(\textit{K-means、 层次、DBSCAN})算法、自动化数据预处理和特征选择方法。
\end{itemize}

\section{\faCogs\ \ 技能 \& \ 自我描述}
\begin{itemize}
    \item >4年\textit{python} 开发与建模经验,熟练使用 \textit{pytorch、numpy、pandas}等库进行数据处理、机器学习算法开发和实验等,熟悉\textit{Caffe、XGBoost、LightGBM}。
    \item >3年\textit{Linux}使用经验,掌握基本bash命令和shell脚本编写,熟练使用\textit{Emacs}(可以写一些个性化指令)、\textit{Git、Awk}等工具。热衷 \LaTeX 写作,独立贡献了校毕业论文 \LaTeX 模板\github[SUIBEthesis]{https://github.com/Yangruipis/SUIBEthesis}。
    \item 1.5年\textit{C++}开发经验,熟悉基本特性,熟练使用\textit{Scons};0.5年\textit{CUDA}开发经验,熟悉核函数编写、以及常规的优化方法;了解 \textit{TensorRT} 和模型计算加速。
    % \item 数理统计基础扎实,熟悉计量经济,多元统计,时间序列,贝叶斯统计等方面的知识,熟练掌握机器学习相关算法及原理。
\end{itemize}

\quad \quad 热爱编程,喜欢思考,追求新技术。英语读写流畅(CET6:541),爱好有摄影(校摄影大赛二等奖)、骑行等。



%% Reference
%\newpage
%\bibliographystyle{IEEETran}
%\bibliography{mycite}
\end{document}

Author: 杨 睿

Created: 2022-12-30 Fri 10:49

Validate