Shreyash Pandey // IBM ನಲ್ಲಿ Software Development Engineer 2
ನಾನು AI ಸಿಸ್ಟಮ್ಗಳು, ಆಟೊಮೇಷನ್ ವರ್ಕ್ಫ್ಲೋಗಳು ಮತ್ತು ಪ್ರೊಡಕ್ಷನ್ನಲ್ಲಿ ಬದುಕಿ ಉಳಿಯುವ ಬ್ಯಾಕೆಂಡ್ ಉತ್ಪನ್ನಗಳನ್ನು ನಿರ್ಮಿಸುತ್ತೇನೆ
ನನ್ನ ಇತ್ತೀಚಿನ ಕೆಲಸ ಅನ್ವಯಿಕ AI ಮತ್ತು ಎಂಜಿನಿಯರಿಂಗ್ ಶಿಸ್ತು ಸಂಧಿಸುವ ಕಡೆ ನಿಂತಿದೆ: locator ಸ್ವಯಂ-ಗುಣಪಡಿಸುವಿಕೆ, semantic retrieval, ಆಂತರಿಕ copilots, ಬಹುಭಾಷಾ model ತರಬೇತಿ, ಮತ್ತು ನೈಜ ಕಾರ್ಯಾಚರಣಾ guardrails ಹೊಂದಿರುವ ಆಟೊಮೇಷನ್ pipelines.
- 5K+ ಟೆಸ್ಟ್ locators ಸ್ವಯಂ-ಗುಣಪಡಿಸಲಾಗಿದೆ
- 3-ಹಂತದ ML ಜೊತೆಗೆ VLM ರಿಕವರಿ ವಿನ್ಯಾಸ
- Hackathon ಗೆದ್ದ semantic search
- ಮೊದಲಿನಿಂದ open-source model ತರಬೇತಿ
ಪ್ರಸ್ತುತ ಪುರಾವೆ ಮೇಲ್ಮೈ
ಪೋರ್ಟ್ಫೋಲಿಯೋದಲ್ಲಿ ಅತ್ಯಂತ ಬಲವಾದ ಸಂಕೇತ ಒಂದೇ ಯೋಜನೆ ಅಲ್ಲ. ಇದು ಕೆಲಸ ಮತ್ತು ಸ್ವತಂತ್ರ ಸಿಸ್ಟಮ್ಗಳಾದ್ಯಂತ ಬಿಡುಗಡೆಯಾದ AI ರಿಕವರಿ ವಿನ್ಯಾಸ, ಸೇವಾ ರಿಲಯಬಿಲಿಟಿ ಮತ್ತು ಪ್ರಾಯೋಗಿಕ model ನಿರ್ಮಾಣದ ಸಂಯೋಜನೆ.
ನಾನು ಯಾವುದಕ್ಕಾಗಿ ಆಪ್ಟಿಮೈಸ್ ಮಾಡುತ್ತೇನೆ
ನನ್ನ ಕೆಲಸದಾದ್ಯಂತ ಸಾಮಾನ್ಯ ಸೂತ್ರವೆಂದರೆ ಅಸ್ಪಷ್ಟತೆಯಲ್ಲಿ ರಿಲಯಬಿಲಿಟಿ. ತರ್ಕಿಸಬೇಕಾದ, ರಿಕವರ್ ಮಾಡಬೇಕಾದ ಮತ್ತು ಆದರೂ ಕಾರ್ಯಾಚರಣಾವಾಗಿ ಸ್ಪಷ್ಟವಾಗಿ ಉಳಿಯುವ ಸಿಸ್ಟಮ್ಗಳು ನನಗೆ ಇಷ್ಟ.
ಅಗ್ಗದ, ವಿಶ್ವಾಸಾರ್ಹ ಫಾಲ್ಬ್ಯಾಕ್ನಿಂದ ಆರಂಭಿಸಿ
ಮೊದಲು ನಿರ್ಣಾಯಕ ರಿಕವರಿಯನ್ನು ಪ್ರಯತ್ನಿಸುವಂತೆ ನಾನು ಸಿಸ್ಟಮ್ಗಳನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸುತ್ತೇನೆ, ನಂತರ ಸಮರ್ಥನೀಯವಾದಾಗ ಮಾತ್ರ ML ಮತ್ತು model-ಆಧಾರಿತ ಫಾಲ್ಬ್ಯಾಕ್ಗಳಿಗೆ ಏರುತ್ತೇನೆ.
ಮೌಲ್ಯಮಾಪನವನ್ನು ಉತ್ಪನ್ನದ ಭಾಗವಾಗಿ ಪರಿಗಣಿಸಿ
ಸಿಸ್ಟಮ್ನಲ್ಲಿ AI ಇದ್ದಾಗ, ಅಳತೆ ಮಾಡುವ ಲೂಪ್ ಐಚ್ಛಿಕವಲ್ಲ. ಗಮನಿಸಬಹುದಾದ ನಿಖರತೆ, drift, error budgets ಮತ್ತು ವೈಫಲ್ಯ ವಿಶ್ಲೇಷಣೆಯ ಬಗ್ಗೆ ನನಗೆ ಕಾಳಜಿ.
ನಾನು ಬಿಡುಗಡೆ ಮಾಡಿದ ಸಿಸ್ಟಮ್ಗಳು
2024 - Present
Software Development Engineer 2
IBM Software Labs · ಬೆಂಗಳೂರು, ಭಾರತ
ಬ್ರೌಸರ್ ಆಟೊಮೇಷನ್ ಮತ್ತು ಟೆಸ್ಟಿಂಗ್ ಉತ್ಪನ್ನಗಳ ಒಳಗೆ ರಿಲಯಬಿಲಿಟಿ-ಪ್ರಧಾನ AI ಸಾಮರ್ಥ್ಯಗಳನ್ನು ನಾನು ವಿನ್ಯಾಸಗೊಳಿಸಿ ಬಿಡುಗಡೆ ಮಾಡುತ್ತೇನೆ. ಈ ಕೆಲಸ embeddings, vision-language models, ಸೇವಾ ವಿಭಜನೆ ಮತ್ತು ಸಾಕಷ್ಟು ಕಾರ್ಯಾಚರಣಾ ಶಿಸ್ತನ್ನು ಒಗ್ಗೂಡಿಸುತ್ತದೆ.
2023 - 2024
Software Engineer 2
Software AG (now IBM) · ಬೆಂಗಳೂರು, ಭಾರತ
ಈ ಹಂತವು ನನ್ನನ್ನು AI ಉತ್ಪನ್ನ ಕೆಲಸದೊಳಗೆ ಆಳವಾಗಿ ಒಯ್ದಿತು: semantic retrieval, ಆಂತರಿಕ copilots ಮತ್ತು ಡೆಮೋಗಳಿಗಿಂತ ಪ್ರಾಯೋಗಿಕ ಉತ್ಪನ್ನ ಅಗತ್ಯಗಳ ಮೇಲೆ ಆಧಾರಿತ ಭವಿಷ್ಯ ಊಹೆ ವ್ಯವಸ್ಥೆಗಳು.
2022 - 2023
Software Engineer
Software AG · ಬೆಂಗಳೂರು, ಭಾರತ
Java, Spring Boot ಮತ್ತು REST APIs ಗಳಾದ್ಯಂತ ಎಂಟರ್ಪ್ರೈಸ್ ಇಂಟಿಗ್ರೇಷನ್ ವೇದಿಕೆ ಸಾಮರ್ಥ್ಯಗಳ ಮೇಲೆ ನಾನು ಕೆಲಸ ಮಾಡಿದೆ, ಪ್ರೊಡಕ್ಷನ್ ಸಿಸ್ಟಮ್ಗಳ ಬಗ್ಗೆ ನಾನು ಇಂದಿಗೂ ಆಲೋಚಿಸುವ ರೀತಿಯನ್ನು ರೂಪಿಸುವ ಬುನಾದಿಯನ್ನು ನಿರ್ಮಿಸಿದೆ.
ಪ್ರಸ್ತುತ ಯೋಜನೆಗಳು
2026 · Decoder-only ಭಾಷಾ ಮಾದರಿ
Phoenix 125M
ಕಸ್ಟಮ್ tokenizer, data pipeline ಮತ್ತು training loop ಜೊತೆಗೆ ಒಂದೇ RTX 3080 Ti ಮೇಲೆ ಮೊದಲಿನಿಂದ ತರಬೇತಿ ಪಡೆದ LLaMA-ಶೈಲಿಯ 125M parameter ಮಾದರಿ.
2026 · ಬಹುಭಾಷಾ ಭಾಷಾ ಮಾದರಿಗಳು
Sweta-Hi and Sweta-Kn
ಕಸ್ಟಮ್ tokenizers ಮತ್ತು ಎಂಡ್-ಟು-ಎಂಡ್ ಬಹುಭಾಷಾ data pipeline ಜೊತೆಗೆ LLaMA-ಶೈಲಿಯ ಆರ್ಕಿಟೆಕ್ಚರ್ ಮೇಲೆ ನಿರ್ಮಿಸಲಾದ ಹಿಂದಿ ಮತ್ತು ಕನ್ನಡ pretraining ಪ್ರಯತ್ನಗಳು.
2026 · Fine-tuning · Text-to-SQL
SQLForge: Mistral 7B QLoRA
Mistral 7B v0.3 ಅನ್ನು ವಿಶ್ವಾಸಾರ್ಹ text-to-SQL ಮಾದರಿಯಾಗಿ ಪರಿವರ್ತಿಸುವ 4-bit QLoRA fine-tune. Phoenix 125M ಗೆ ಬಳಸಿದ ಅದೇ 12 GB GPU, ಮುಂಚಿತವಾಗಿ ನಿಗದಿಪಡಿಸಿದ 3.75 GB VRAM ಹೆಡ್ರೂಮ್, ಮತ್ತು ಮೊದಲ WikiSQL ರನ್ ಮೆಟ್ರಿಕ್ ಸುಳ್ಳು ಹೇಳುತ್ತಿದೆ ಎಂದು ತೋರಿಸಿದ ನಂತರ schema-aware ಮೌಲ್ಯಮಾಪನದ ಮರುನಿರ್ಮಾಣ.
ಎಲ್ಲಾ ನಿರ್ಮಾಣಗಳನ್ನು ನೋಡಿ
ಪೂರ್ಣ ಯೋಜನಾ ಪೋರ್ಟ್ಫೋಲಿಯೋವನ್ನು ಅನ್ವೇಷಿಸಿ
ನನ್ನ ಮುಂದಿನ ಪಾತ್ರವನ್ನು ಹುಡುಕುತ್ತಿದ್ದೇನೆ
AI ಸಿಸ್ಟಮ್ಸ್ ಎಂಜಿನಿಯರ್, ಬೆಂಗಳೂರು, ಭಾರತ
AI ಸಿಸ್ಟಮ್ಗಳು, ಬ್ಯಾಕೆಂಡ್ ಎಂಜಿನಿಯರಿಂಗ್ ಮತ್ತು ರಿಲಯಬಿಲಿಟಿ ಕೆಲಸ ಒಂದಾಗಿ ಸೇರುವ ಪಾತ್ರಗಳಲ್ಲಿ ನನಗೆ ಹೆಚ್ಚು ಆಸಕ್ತಿ. ಸಾಮಾನ್ಯವಾಗಿ ಇದರ ಅರ್ಥ agent infrastructure, ಮೌಲ್ಯಮಾಪನ-ಪ್ರಧಾನ ಉತ್ಪನ್ನ ಕೆಲಸ, ಆಟೊಮೇಷನ್ ವೇದಿಕೆಗಳು, ಅಥವಾ ಡೆವಲಪರ್ ಟೂಲಿಂಗ್.