Jeffrey Wang
文章87
标签148
分类12
我的2024年记-续走 AI 路及新生命的诞生

我的2024年记-续走 AI 路及新生命的诞生

前言

距我上次写年终总结已经快四年了,上一次写总结《我的2020年记-大浪潮下的小小打工人》的时候,疫情还在肆虐,而现在疫情离我们远去已经有两年了。

跟 2020 年的有一个共性是,我的工作和生活都有了较大的变化。

比如 2020 那年,我因为疫情换了工作,而 2024 这年,又因为个人发展和大环境寒冬换了工作;

2020 那年,我跟我老婆还在见家长的阶段,而现在我俩自己已成了家长;

AI 对我的影响

这两年对互联网、对个人开发者冲击最大的产品当属大语言模型了,上家公司因为部分产品比较有 AI 基因,加之老板对 AI 相关领域比较敏锐,所以大概在 22 年中 Stable Diffusion 面世之后就对 AI 绘画大模型有所研究,做了一款 AI 头像生成类的产品,期间对模型部署、微调、运维方面又得到了更多的了解

而 24 年五月换工作之后,工作内容同样专注于大模型应用上,这一篇博客 《建立大模型的感性认知》就是用于入职后一次周会分享的,不过个人觉得目前的大模型局限有很多,只能作为辅助工具去使用,更多实现细节、架构、逻辑是否合理需要靠人类去辨别,真正解决问题的能力和技术视野是目前的 AI 无法替代的。

编程效率的大提升

大概 22 年底 ChatGPT-3.5 发布后,用 GPT 辅助编程就成了日常工作流的一部分。

不过当时因为模型能力过于孱弱,生成的代码着实没有自己生成的好,只能给他少部分函数编写的任务和查询资料的任务,并且在业余时间思考了一下 AI 带来的高效率工具下,有什么可能的、有前景的方向和机会,整理了一篇博客 《基于ChatGPT恐怖能力的高效率工具涌现意味着什么》

Cursor 带来的高效率编程体验

再往后,Cursor 这个辅助编程产品出来了,带 codebase 和代码并支持片段引用增强了代码生成的效果,我发现可以把更多的功能交给 AI 实现了。

比如当时我为了公司新产品正在学习 NextJS + ReactJS,但当时我对 React 并不熟悉,而 AI 在新技术入门上对我帮助最大的是,我问它“实现 XX 功能有什么方法和建议” 后,拿到关键信息继续索引资料就可以实现快速上手。

image

以及在 Cursor 的帮助下,可以对一大段代码逻辑进行重写或新增,而在等待生成结果的时候就可以继续思考下一步要做什么?以及整体结构的规划是什么?

在这样的节奏和状态下,业务逻辑实现的思路是不会被代码实现细节所打断的,只需要等待生成完毕后再校对一下逻辑,或者让 GPT 对关键逻辑写几段测试用例保证输入输出正常即可,省去了很多编码的工作量。

image

所以 AI 对我整体能力的广度和速度的加持是成倍的,可以让我在不熟悉 Bash 的情况下写出很多有用高效的运维脚本、可以让我快速上手一门本来一无所知的新技术,还可以让我在编写业务逻辑的时候更加的流畅和快乐。

高效解决定制需求

最近一个对我非常有帮助的案例是:用 Cursor + Deepseek V3 在三天内开发完了一个“有声书字幕翻译、自动总结标题”的开源项目 github.com/LiberSonora/LiberSonora

image

事情的起因是我在搬家后离地铁站点较远,所以网上下载了一些有声读物,而这些有声读物大多是没有字幕和有意义的标题的,就无法通过标题和内容反向定位想听的部分。

而开发的这个工具支持语音识别自动字幕生成、双语字幕、文本纠错、自动标题生成、批量重命名、手动编辑结果等等功能,放到网易云音乐中实机体验了一下感觉还可以。

image

image

实现的时候,采用了开源的 AI 语音识别框架 FunASR + 音频降噪服务 ClearerVoice-Studio + 开源大模型 Qwen2.5-7B 和运行本地大模型的服务框架 ollama + streamlit.io 做了一个自动识别字幕的工具,并且根据字幕内容自动总结标题,这个项目超过 95%+ 的代码、Logo、README 都是 Cursor 帮我做的,实现效果我个人觉得还挺符合预期的,大家如果也有类似的需求都可以参与或提出意见,github.com/LiberSonora/LiberSonora/discussions

image

工作

在工作上,第一季度虽然一直有在尝试寻找新机会,但老东家的 AI 项目还是在不断推进的,推进过程本身就是一个很好的学习机会,很大程度提升了我对大模型、AI 编程相关的理解。

五月中旬入职了新公司英语流利说,主要开发语言也从 Typescript 后端转为 Golang 后端,依旧从事 AI 应用相关的工作,倒是跟未来期望深耕的方向契合。

换工作

上家公司在离职前主要做的产品是订阅制的海外 ChatBot 应用,有好几个分站,做的较好的一个分站每天能有 2w 的独立访问,同类型产品里边看了看算不错。

image

老板对 AI 和新技术很敏锐,也给了我很大的帮助,整个工作氛围也不沉重。因为公司裁了几波员人比较少,离职前还简单做了下公司的总成本估计和总收入估计,如果保持当时产品的势头,大概再跑两个月就能盈亏平衡了。

不过最后考虑到个人发展、未来生活节奏、项目前景等等很多问题,恕不能细聊😁,最终还是决定溜了。

求职是挺冷

虽然我是在 2024 年五月才正式开溜,但相关的准备早在 2023 年底就开始了。求职时我觉得 AI 会是下一个重要的应用方向,所以求职目标就是后端+AI应用的岗位,而具体的后端语言倒没有太限定,可以是 Golang,可以是 Node、Python 等等。因为当时已经可以在 AI 辅助下忽视一些技术栈的差异,更加专注于业务逻辑的思考了,而个人认为在不远的未来这个趋势会越来越显著。

博主毕业于一家二本院校,无大厂经历,从 23 年底开始求职面了快 20 家大大小小的公司,有几个感受:

  • 年底的刚需岗位给的面试机会更多,年初反而由于求职竞争激烈,招聘的公司翻来覆去就那几家,有时候简历投出去半个月才有信,直到 24 年四月才有所好转
  • 要求经验匹配性高的企业比较多,大多是刚需岗,希望入职后无缝衔接前任工作
  • 薪资不太好谈,到谈薪环节压薪现象严重,不少平薪和降薪的岗位

最终选择了入职英语流利说这家公司,虽然入职后从家庭角度考虑,搬家到离公司一个半小时行程的青浦区去了,但整体来说还是比较适合我的,主要的编程语言从 Typescript 切到了 Golang,在 AI 的帮助下适应的还挺顺利。

个人提升

社区贡献

24 年更多忙于自己的找工作、照顾怀孕的老婆,开源贡献上明显少了很多。我在 23 年还给 AuthJS、Flowise(Langchain 的可视化工作流项目)改了一些 BUG 贡献了一些代码。

image

到了 24 年,除了元旦前三天肝出来的“有声书字幕识别和自动标题”项目 github.com/LiberSonora/LiberSonora 外,其他贡献就几乎没有了,commit 图比脸还干净。

image

未来也许会基于有声书的场景继续扩展,学一下 Flutter,能写自己的 APP 并上线,做一枚真正的全干工程师~

这个开源项目上线后,给我下载有声书的网站 第一故事 的站长去了一封邮件,把 AI 转换过的几本有声书同步给了他,看到我的贡献被认可并出现在网站上造福更多人的时候真的非常开心。

image

有声书马克思《资本论》MP3免费打包下载 276集(其中之一)

image

技术领域的提升

2024 年主要是继续在 AI 和大模型领域继续积累经验:

  • text-generation-inference 给前公司做了私有模型部署相关的运维工作。

  • 做了一个内部用的大模型测试框架,定量研究在不同的模型量化参数、推理参数下,哪个组合的效果最佳。

  • 研究大模型原理,关注最新动态,现在正在尝试跟上社区步伐,微调出适配特定领域的大模型

开发领域中:

  • 工作里实际应用了 ReactJS + NuxtJS,说实话不太好用,特别 NuxtJS 的中间件等功能,因为要跟 Vercel 部署深度嵌入,灵活性太低了。
  • 后来自己做前后端大一统的项目改用了 Vue + NextJS,虽然它也不完美,依旧有非常多非常多的坑要踩,但被钳制的感觉没有那么明显。
  • 更深入研究了 Golang 技术栈以适应新工作的需要。

个人生活

升级有娃一族

在我跟老婆结婚差不多一周年、恋爱五周年的时候,冒出来了要孩子的想法。虽然身边未婚、未育、丁克的朋友不少,家里也没怎么催,我们当然也可以多享受几年快活日子。

不过对于双沪飘不打算丁克不打算有人全职带娃的打工人家庭来说,这样的家庭情况几乎必定要靠上一辈的全力帮助才可以比较顺利的延续后代(用资本主义的话讲叫“劳动力的再生产”,但对个人来说也是一种情感上的需要),而在感情状况、经济情况允许的情况下,在自己年纪不算大,父母年纪不算大的时候生育对我们来说也是一个不错的选择了。

现在还记得 2024年 2 月24号那天,正值元宵佳节,是检查到宝宝痕迹的第一天,我老婆前一天晚上跟我一起去买了登山鞋,元宵那天特别想去龙王山赏雪,看到两道杠我老婆都快哭出来了。

f104953727789ca44d4d5530a39ed52

然后就是选定医院去定期产检,这边情况是非高龄产妇无基础病,所以就近找了上海长妇幼,一家老牌的妇幼保健院,第一次去愚园路那边的时候是春天,还挺漂亮的,但不知道是不是龙年的原因,检查的人确实很多。

497ac0284b50b7d6daaaf85cd5c7296

f9df5b8d5d22a58ed89073a9cedb150

我老婆说他第一次查到心跳、通过 B 超看到宝宝的时候,边听边哭。再后来慢慢地,肚子越来越大,行动也愈发不便起来。

MVIMG_20241020_174612_1

特别头胎开指慢,足月之后阵痛了好几天,下午两点到医院开 0.5 指,然后一直痛到第二天凌晨3点才开两指,整个过程真的很疼,只能硬抓着她的手尽量转移注意力。

MVIMG_20241026_030010

三点打无痛之后宫缩就慢慢小了,睡了一会儿恢复体力,直到凌晨五六点推进产房接生,在护士小姐的帮助下顺利的生产了,全程陪产看着老婆的努力,真的太不容易了。

MVIMG_20241026_050849

住院的那几天由于产后出血,我老婆整体是很虚弱的状态,想母乳但喂奶翻身都没力气。

MVIMG_20241027_061447

住院部规定只能进一位陪护,那这个人一定得是我,责无旁贷。陪护时的节奏基本是两小时醒一次,醒来之后忙活半小时到一小时,比如凌晨两点起来喂奶、换尿布、哄睡、清洗用具到凌晨三点;然后五点又起来喂奶、换尿布,迎接护士小姐的健康检查,卫生检查等等。

image

住院陪护两天下来,感觉整个人都是飘的,加上一直流汗味道也不太好,但在护士小姐的帮组下快速的熟悉了带娃的各个环节和流程,学会了喂奶,脐带消毒,以及各种抱法,竖抱、斜抱、哺乳抱、反哺乳抱、飞机抱,后面听我老婆说护士夸我是这边学的最快的爸爸哈哈哈!!!

出院前一天让家长替了我一晚上,回家快速收拾了一下自己并给老婆预定了一大束花,以宣告这个家庭全新生活的开始!

image

健康

大家一定注意个人健康,我可能是长期不太爱喝水,今年痛风犯了两次,尿酸高的吃药都降不下去,第一次发作是换工作前大概3月底,自己骑电瓶车蹦到附近的医院的,急性期都有 543 的尿酸,很高了。

image

吃了俩月的非布司他之后一直没去复查,7月的时候又发作了一次,检查出来急性期七百多。

image

然后医生又开了非布司他,继续哐哐吃药,到后来宝宝都出生了,想着回归工作前再去社区医院复查一下,期间饮水量也还正常,结果一查尿酸六百多了,医生还给开非布司他让继续吃。

image

总感觉要么药有问题,要么治疗方向有问题,现在换个方向看中医试试,中医给到的诊断是肝肾两虚,阴虚火旺,尝试吃一个月中药调理,才开始,看啥时候见效。

image

玩 NAS

我的 NAS 是在 2023 年 4 月左右捡垃圾捡来的,CPU 是 4600T,显卡是 P104-100 当时打算用来跑 AI 绘画,配件全靠二手捡垃圾,总价 ¥850,性价比贼高。

image

但有一说一,当时花 ¥115 买一块儿 G4600T 有点大冤种不够垃圾佬,虽说核显确实不错能硬解 8K 10bit,但毕竟这个主板是可以上 E3V5 的,整一个 E3 1225V5 也就七十块钱,照样带了个能用的核显。

image

捡的主板和机箱设计都很不合理,换个塔式散热器搞的滴血认亲了,然后我就在笔记中留了这样一条警告,警示自己以后别再折腾这台机器了,要实在性能不够用换台新的。

Warning:闲的没事干一定不要换 CPU 散热器那套东西,因为搞的时候一定要把主板拆下来,内存拆下来,然后把底座的上半部分掀起来,把散热器的一侧挂上去,然后把上半部分扣紧在主板上,然后再扣上扣具,而且风扇一定要提前塞进去,想先扣上了再塞是不可能的。

后面这台 “NAS” 慢慢变成了一台综合的服务器了,跑了四十多个常用服务在上面,还跑了本地大模型和 AI 绘画等重负载的东西,未来还打算让它承担本地模型训练的工作,G4600T 就有点太不够看了。

image

image

所以分别在 6 月、11月的时候买了一堆配件进行升级,留了升级余量,已经有点违背垃圾佬教义了,主要是:

  • 6月 E3 降了一波价,花巨资 ¥180 升到了 E3-1275V5,4核8线程,性能类似 I7-7700 也足够了,内存频率只支持 2333

  • image

  • 11月固态的价格还行,花了 685 买了梵想 S790E 2TB 做系统盘(系统迁移又一波折腾),换完之后系统响应速度快非常多,docker 打包、加载 AI 模型这些场景贼顺畅

    image

  • 12月我的好兄弟送了我一块儿 2080TI,原来捡的电源有点带不动了,咸鱼淘了一下结果淘到了翻新的电源,怕炸于是去买了全新鑫谷 G850W,花了 ¥400,备着后面战未来。

    image

    image

新 CPU E3V5 的 TDP 确实高了些,但待机功耗其实并未上去;压测6分钟,温度 65度 3.7GHz 未降频,满载104w的功耗,平时所有硬件加一起 38w 左右,反而比 G4600T 更低。

12 月的时候因为折腾本地大模型应用,有时候需要用移动设备访问内网服务器上的服务,但有些能力特性只能 HTTPS 下才可以运行,所以就折腾了一下内网批量 HTTPS 的方案。

image

通过这套方案,所有的内网网站都有一个自己的子域,并通过同一个自动续期的泛签名证书实现 HTTPS,具体过程整理为了博客 《给 NAS 内网服务自动配置免费 HTTPS》

PS5+Switch

很开心的一点是,老婆理解并支持我通过玩游戏的方式放松娱乐,她也知道我想买游戏机已经很久了,所以在 23 年底双十一的时候送了我一台 PS5,版本和店铺是自己选的,京东数码海外旗舰店,日版 ¥2995。

附图:你怎么知道我老婆给我买 PS5 、 Switch 还有 4K 显示器.jpg

时间点我记得特别清楚,PS5 到货的那天是周五,我老婆有事要回老家,而我加班上线到凌晨12点多才回去。虽然回去挺累了,但我还是折腾一通,玩到凌晨一点多才放手。

image

后来还写了一篇博客记录这个过程《心心念了3年的XSX,最终还是选了PS5

回想一下今年玩了些啥,Switch 几乎完全吃灰,偶尔拉出来玩玩健身环,其他都是在 PS5 上玩的。

黑神话悟空:

一周目通关,而且是在带娃期间通关(娃哄睡了我不睡,家务干完可以黑猴启动了),买了豪华版支持国产,虽然打小黄龙、王神官有点受罪,但整体玩的很开心,美爆了

黑神話:悟空_20241106110416

热梗:我来助你.jpg

黑神話:悟空_20240916214807

黑神話:悟空_20240917145355

地平线2 西部禁域:

一周目中,画面表现确实无敌,游戏性也不错,如果能多还原一点脸模的颜值那就更棒了。

地平線 西域禁地_20241222205015

地平線 西域禁地_20241230223748

地平線 西域禁地_20250103224043

无线暖暖:

对我来说就是拍照暖暖模拟器,充钱是不会充钱的,让我拍照就行

image

image​​​

image

無限暖暖_20241221202014

無限暖暖_20241226225707

战神4:

又翻出来两周目通关,经典线性游戏,除了女武神比较有难度,其他都是解谜看电影

God of War_20231230145748

God of War_20231230142929

星球大战 绝地组织陨落:

一周目通关,玩完就没啥深刻的印象了,不同的星球飞飞飞,打怪砍小兵,最后打个大 BOSS 结束

《星際大戰 絕地:組織殞落™》_20240101211524

《星際大戰 絕地:組織殞落™》_20240120183728

只狼:

操作太受虐了,着实有点推不动

Shadows Die Twice_20241116110747

底特律变人:

互动电影神作,非常震撼,打通了三队全活结局

Detroit_ Become Human_20240317194544

Detroit_ Become Human_20240324002819

没玩下去的:

FARCRY 5,突突突打邪教兴奋不起来

Far Cry® 5_20240413094350

CONTROL,带点儿恐怖色彩,战斗不太紧凑,玩不动

Control Ultimate Edition_20240430212743

PREY,玩了一半,孤身一人在太空面临电车难题,挺好玩但略显惊悚

Prey_20240127210810

Prey_20240128191422

老车子

目前开的车子是 21 年左右买的亲戚的二手车,有“修理厂噩梦”之称的“老款红色雪佛兰科鲁兹”,车子平时开着还行,但几乎每年都要折腾那么一次,今年尤甚,久病成医,我都快熟悉里边的易损部件了。

时间线大概是这样的:

  • 23 年十一路上,发动机窜油咔咔冒白烟要大修,当时有点儿报废的想法,但身处异地而且过节返乡事情本来就多,处理起来太麻烦了,硬着头皮还是修了,花了5k,开着修车老板的钓鱼车继续行程
  • 24 年初,大概四月份,稳妥起见让我老婆开车上下班,结果地下车库倒车的时候变速箱打齿直接动不了了,换了个手动挡变速箱和其他关联部件花了快3k,修完换挡还是卡,再换了个换挡机构好转了。
  • 24年中大概 9 月,天气可热,有次出门车里空调开猛了把压缩机烧了,开着窗回到家,停好车发现车窗摇不上去了,去换了压缩机和车窗升降器,又花了小一千

image

image​​​

我们倒不是完全没买新车的预算,主要未来自驾出行频率又不高,每次车子坏了都跟我老婆都从性价比出发考虑,修好兴许能再管三年,比起买新车保费+买车的费用加起来还是低的,虽然最后一点点投入进去之后发现修车的成本也不低了😭

不过俩大件大修完之后,觉得这车子又能行了,应该还能再陪我们几年,到时候根据最新需求再换~

生活点滴

2月初老婆的发小结婚,我去客串了一下婚礼摄影师,网上找了教程、注意事项,婚礼当天咔咔的抓拍,64GB 的内存卡都给塞满了,最终反馈还不错,这手艺咋说都得值他三五百哈哈(隐私关系,只发侧脸)。

image

IMG_3250

2月底回到上海后,去了松江那边辰山植物园赏樱很不错

20240331210420

IMG_3564

4月去了绍兴的石井水库

image

4月还去看了上海博物馆看了三星堆展览,很是震撼古人的巧思

MVIMG_20240406_140015

MVIMG_20240406_152827

MVIMG_20240406_152620

5月去了海昌海洋公园,天气挺热,去看了大蓝鲸表演

IMG_5419

IMG_5503

5月赶上换工作的 GAP,老婆孕中期也属于比较稳定的时候,抓住机会自己去了趟厦门看海,逛了厦大、鼓浪屿。

image

image

6月端午节有假期,跟朋友一起去崇明玩了一趟,东平国家森林公园挺值得逛的

image​​IMG_6057

IMG_6008

就是有些设施老化之后,看着有点恐怖片

image

6月底,考虑到未来带娃的生活以及家长过来的居住便利性,放弃了快排到的市筹公租房(上海市筹是真难排,排了三年多才轮到),在老婆公司附近找了个大房东两室,还挺适合我们的,就是离我上班着实有点远,单程一个半小时。

image

7月回老家参加奶奶的百岁寿宴

MVIMG_20240714_121907

9月已经比较显怀了,中秋那天去淀山湖赏月,人还挺多的,休闲的走了一走

image

IMG_6855

10月,宝宝出生了,之后全家人的目光都投向了这个小可爱,在家长的帮助和老婆的共同努力下,我也慢慢的回到工作节奏中去了。

image

24 年由于年初开始就有宝宝,就没有像 23 年那样到处徒步爬山、逛园林,很少有中长途的旅行,不过这也是多彩多变生活的一部分,不会总是激昂的高山流水,也有静好的清风明月。

未来

2025 在生活上打算继续做好父母,学习更多育儿知识,并保持身体健康给娃做好榜样;工作和职业发展上,在 AI 和大模型应用领域更加深入,有时间更多的参与开源社区建设。

祝大家 2025 新年快乐,身体健康,共勉~

本文作者:Jeffrey Wang
本文链接:https://blog.wj2015.com/2025/01/05/%E6%88%91%E7%9A%842024%E5%B9%B4%E8%AE%B0-%E7%BB%AD%E8%B5%B0-AI-%E8%B7%AF%E5%8F%8A%E6%96%B0%E7%94%9F%E5%91%BD%E7%9A%84%E8%AF%9E%E7%94%9F/
版权声明:本文采用 CC BY-NC-SA 3.0 CN 协议进行许可
×