Shreyash Pandey // IBM ನಲ್ಲಿ Software Development Engineer 2

ನಾನು AI ಸಿಸ್ಟಮ್‌ಗಳು, ಆಟೊಮೇಷನ್ ವರ್ಕ್‌ಫ್ಲೋಗಳು ಮತ್ತು ಪ್ರೊಡಕ್ಷನ್‌ನಲ್ಲಿ ಬದುಕಿ ಉಳಿಯುವ ಬ್ಯಾಕೆಂಡ್ ಉತ್ಪನ್ನಗಳನ್ನು ನಿರ್ಮಿಸುತ್ತೇನೆ

ನನ್ನ ಇತ್ತೀಚಿನ ಕೆಲಸ ಅನ್ವಯಿಕ AI ಮತ್ತು ಎಂಜಿನಿಯರಿಂಗ್ ಶಿಸ್ತು ಸಂಧಿಸುವ ಕಡೆ ನಿಂತಿದೆ: locator ಸ್ವಯಂ-ಗುಣಪಡಿಸುವಿಕೆ, semantic retrieval, ಆಂತರಿಕ copilots, ಬಹುಭಾಷಾ model ತರಬೇತಿ, ಮತ್ತು ನೈಜ ಕಾರ್ಯಾಚರಣಾ guardrails ಹೊಂದಿರುವ ಆಟೊಮೇಷನ್ pipelines.

  • 5K+ ಟೆಸ್ಟ್ locators ಸ್ವಯಂ-ಗುಣಪಡಿಸಲಾಗಿದೆ
  • 3-ಹಂತದ ML ಜೊತೆಗೆ VLM ರಿಕವರಿ ವಿನ್ಯಾಸ
  • Hackathon ಗೆದ್ದ semantic search
  • ಮೊದಲಿನಿಂದ open-source model ತರಬೇತಿ

ಪ್ರಸ್ತುತ ಪುರಾವೆ ಮೇಲ್ಮೈ

ಪೋರ್ಟ್‌ಫೋಲಿಯೋದಲ್ಲಿ ಅತ್ಯಂತ ಬಲವಾದ ಸಂಕೇತ ಒಂದೇ ಯೋಜನೆ ಅಲ್ಲ. ಇದು ಕೆಲಸ ಮತ್ತು ಸ್ವತಂತ್ರ ಸಿಸ್ಟಮ್‌ಗಳಾದ್ಯಂತ ಬಿಡುಗಡೆಯಾದ AI ರಿಕವರಿ ವಿನ್ಯಾಸ, ಸೇವಾ ರಿಲಯಬಿಲಿಟಿ ಮತ್ತು ಪ್ರಾಯೋಗಿಕ model ನಿರ್ಮಾಣದ ಸಂಯೋಜನೆ.

ರಿಕವರಿ ಏಣಿ
3 tiers
ಮೊದಲು CSS selectors, ನಂತರ embeddings, ನಂತರ ಅಸ್ಪಷ್ಟತೆ ಹೆಚ್ಚಿರುವಾಗ IBM Granite 3.3 VLM.
Runtime ಪ್ರಮಾಣ
4K-5K rpm
SAT runtime ಅನ್ನು ಸಬ್-ಸೆಕೆಂಡ್ ಲೇಟೆನ್ಸಿ ಮತ್ತು ಬಿಡುಗಡೆ-ದರ್ಜೆಯ ಕಾರ್ಯಾಚರಣಾ ನಿರ್ಬಂಧಗಳೊಂದಿಗೆ ನಾಲ್ಕು ಸೇವೆಗಳಾಗಿ ವಿಭಜಿಸಲಾಗಿದೆ.
Model ಟ್ರ್ಯಾಕ್
125M
Phoenix 125M ಜೊತೆಗೆ ಕಸ್ಟಮ್ tokenizers ಮತ್ತು training pipelines ಗಳೊಂದಿಗೆ ನಿರ್ಮಿಸಿದ ಬಹುಭಾಷಾ pretraining ಕೆಲಸ.
5K+ ಟೆಸ್ಟ್ locators ಸ್ವಯಂ-ಗುಣಪಡಿಸಲಾಗಿದೆ3-ಹಂತದ ML ಜೊತೆಗೆ VLM ರಿಕವರಿ ವಿನ್ಯಾಸHackathon ಗೆದ್ದ semantic searchಮೊದಲಿನಿಂದ open-source model ತರಬೇತಿ
5K+ ಟೆಸ್ಟ್ locators ಸ್ವಯಂ-ಗುಣಪಡಿಸಲಾಗಿದೆ
4 SAT runtime ನಲ್ಲಿ microservices
83% ಫಾಲ್‌ಬ್ಯಾಕ್ ಮೋಡ್‌ನಲ್ಲಿ Chrome ನಿಖರತೆ
70% ಕಡಿಮೆ ಆಂತರಿಕ ಬೆಂಬಲ ಟಿಕೆಟ್‌ಗಳು
99.99% ಊಹೆಯಿಂದ ಬೆಂಬಲಿತ ಲಭ್ಯತೆ
1st TechInterrupt ನಲ್ಲಿ ಭಾರತದಲ್ಲಿ ಸ್ಥಾನ

ನಾನು ಯಾವುದಕ್ಕಾಗಿ ಆಪ್ಟಿಮೈಸ್ ಮಾಡುತ್ತೇನೆ

ನನ್ನ ಕೆಲಸದಾದ್ಯಂತ ಸಾಮಾನ್ಯ ಸೂತ್ರವೆಂದರೆ ಅಸ್ಪಷ್ಟತೆಯಲ್ಲಿ ರಿಲಯಬಿಲಿಟಿ. ತರ್ಕಿಸಬೇಕಾದ, ರಿಕವರ್ ಮಾಡಬೇಕಾದ ಮತ್ತು ಆದರೂ ಕಾರ್ಯಾಚರಣಾವಾಗಿ ಸ್ಪಷ್ಟವಾಗಿ ಉಳಿಯುವ ಸಿಸ್ಟಮ್‌ಗಳು ನನಗೆ ಇಷ್ಟ.

ಅಗ್ಗದ, ವಿಶ್ವಾಸಾರ್ಹ ಫಾಲ್‌ಬ್ಯಾಕ್‌ನಿಂದ ಆರಂಭಿಸಿ

ಮೊದಲು ನಿರ್ಣಾಯಕ ರಿಕವರಿಯನ್ನು ಪ್ರಯತ್ನಿಸುವಂತೆ ನಾನು ಸಿಸ್ಟಮ್‌ಗಳನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸುತ್ತೇನೆ, ನಂತರ ಸಮರ್ಥನೀಯವಾದಾಗ ಮಾತ್ರ ML ಮತ್ತು model-ಆಧಾರಿತ ಫಾಲ್‌ಬ್ಯಾಕ್‌ಗಳಿಗೆ ಏರುತ್ತೇನೆ.

ಮೌಲ್ಯಮಾಪನವನ್ನು ಉತ್ಪನ್ನದ ಭಾಗವಾಗಿ ಪರಿಗಣಿಸಿ

ಸಿಸ್ಟಮ್‌ನಲ್ಲಿ AI ಇದ್ದಾಗ, ಅಳತೆ ಮಾಡುವ ಲೂಪ್ ಐಚ್ಛಿಕವಲ್ಲ. ಗಮನಿಸಬಹುದಾದ ನಿಖರತೆ, drift, error budgets ಮತ್ತು ವೈಫಲ್ಯ ವಿಶ್ಲೇಷಣೆಯ ಬಗ್ಗೆ ನನಗೆ ಕಾಳಜಿ.

ನಾನು ಬಿಡುಗಡೆ ಮಾಡಿದ ಸಿಸ್ಟಮ್‌ಗಳು

2024 - Present

Software Development Engineer 2

IBM Software Labs · ಬೆಂಗಳೂರು, ಭಾರತ

ಬ್ರೌಸರ್ ಆಟೊಮೇಷನ್ ಮತ್ತು ಟೆಸ್ಟಿಂಗ್ ಉತ್ಪನ್ನಗಳ ಒಳಗೆ ರಿಲಯಬಿಲಿಟಿ-ಪ್ರಧಾನ AI ಸಾಮರ್ಥ್ಯಗಳನ್ನು ನಾನು ವಿನ್ಯಾಸಗೊಳಿಸಿ ಬಿಡುಗಡೆ ಮಾಡುತ್ತೇನೆ. ಈ ಕೆಲಸ embeddings, vision-language models, ಸೇವಾ ವಿಭಜನೆ ಮತ್ತು ಸಾಕಷ್ಟು ಕಾರ್ಯಾಚರಣಾ ಶಿಸ್ತನ್ನು ಒಗ್ಗೂಡಿಸುತ್ತದೆ.

2023 - 2024

Software Engineer 2

Software AG (now IBM) · ಬೆಂಗಳೂರು, ಭಾರತ

ಈ ಹಂತವು ನನ್ನನ್ನು AI ಉತ್ಪನ್ನ ಕೆಲಸದೊಳಗೆ ಆಳವಾಗಿ ಒಯ್ದಿತು: semantic retrieval, ಆಂತರಿಕ copilots ಮತ್ತು ಡೆಮೋಗಳಿಗಿಂತ ಪ್ರಾಯೋಗಿಕ ಉತ್ಪನ್ನ ಅಗತ್ಯಗಳ ಮೇಲೆ ಆಧಾರಿತ ಭವಿಷ್ಯ ಊಹೆ ವ್ಯವಸ್ಥೆಗಳು.

2022 - 2023

Software Engineer

Software AG · ಬೆಂಗಳೂರು, ಭಾರತ

Java, Spring Boot ಮತ್ತು REST APIs ಗಳಾದ್ಯಂತ ಎಂಟರ್‌ಪ್ರೈಸ್ ಇಂಟಿಗ್ರೇಷನ್ ವೇದಿಕೆ ಸಾಮರ್ಥ್ಯಗಳ ಮೇಲೆ ನಾನು ಕೆಲಸ ಮಾಡಿದೆ, ಪ್ರೊಡಕ್ಷನ್ ಸಿಸ್ಟಮ್‌ಗಳ ಬಗ್ಗೆ ನಾನು ಇಂದಿಗೂ ಆಲೋಚಿಸುವ ರೀತಿಯನ್ನು ರೂಪಿಸುವ ಬುನಾದಿಯನ್ನು ನಿರ್ಮಿಸಿದೆ.

ಪ್ರಸ್ತುತ ಯೋಜನೆಗಳು

2026 · Decoder-only ಭಾಷಾ ಮಾದರಿ

Phoenix 125M

ಕಸ್ಟಮ್ tokenizer, data pipeline ಮತ್ತು training loop ಜೊತೆಗೆ ಒಂದೇ RTX 3080 Ti ಮೇಲೆ ಮೊದಲಿನಿಂದ ತರಬೇತಿ ಪಡೆದ LLaMA-ಶೈಲಿಯ 125M parameter ಮಾದರಿ.

PyTorchTransformersTokenization
ಮಾದರಿ ಕಾರ್ಡ್ ನೋಡಿ

2026 · ಬಹುಭಾಷಾ ಭಾಷಾ ಮಾದರಿಗಳು

Sweta-Hi and Sweta-Kn

ಕಸ್ಟಮ್ tokenizers ಮತ್ತು ಎಂಡ್-ಟು-ಎಂಡ್ ಬಹುಭಾಷಾ data pipeline ಜೊತೆಗೆ LLaMA-ಶೈಲಿಯ ಆರ್ಕಿಟೆಕ್ಚರ್ ಮೇಲೆ ನಿರ್ಮಿಸಲಾದ ಹಿಂದಿ ಮತ್ತು ಕನ್ನಡ pretraining ಪ್ರಯತ್ನಗಳು.

Multilingual NLPData engineeringCustom tokenizers
ಮಾದರಿ ಕಾರ್ಡ್ ನೋಡಿ

2026 · Fine-tuning · Text-to-SQL

SQLForge: Mistral 7B QLoRA

Mistral 7B v0.3 ಅನ್ನು ವಿಶ್ವಾಸಾರ್ಹ text-to-SQL ಮಾದರಿಯಾಗಿ ಪರಿವರ್ತಿಸುವ 4-bit QLoRA fine-tune. Phoenix 125M ಗೆ ಬಳಸಿದ ಅದೇ 12 GB GPU, ಮುಂಚಿತವಾಗಿ ನಿಗದಿಪಡಿಸಿದ 3.75 GB VRAM ಹೆಡ್‌ರೂಮ್, ಮತ್ತು ಮೊದಲ WikiSQL ರನ್ ಮೆಟ್ರಿಕ್ ಸುಳ್ಳು ಹೇಳುತ್ತಿದೆ ಎಂದು ತೋರಿಸಿದ ನಂತರ schema-aware ಮೌಲ್ಯಮಾಪನದ ಮರುನಿರ್ಮಾಣ.

QLoRAFine-tuningbitsandbytes
HuggingFace ನಲ್ಲಿ ಮಾದರಿ ನೋಡಿ

ಎಲ್ಲಾ ನಿರ್ಮಾಣಗಳನ್ನು ನೋಡಿ

ಪೂರ್ಣ ಯೋಜನಾ ಪೋರ್ಟ್‌ಫೋಲಿಯೋವನ್ನು ಅನ್ವೇಷಿಸಿ

ನನ್ನ ಮುಂದಿನ ಪಾತ್ರವನ್ನು ಹುಡುಕುತ್ತಿದ್ದೇನೆ

AI ಸಿಸ್ಟಮ್ಸ್ ಎಂಜಿನಿಯರ್, ಬೆಂಗಳೂರು, ಭಾರತ

AI ಸಿಸ್ಟಮ್‌ಗಳು, ಬ್ಯಾಕೆಂಡ್ ಎಂಜಿನಿಯರಿಂಗ್ ಮತ್ತು ರಿಲಯಬಿಲಿಟಿ ಕೆಲಸ ಒಂದಾಗಿ ಸೇರುವ ಪಾತ್ರಗಳಲ್ಲಿ ನನಗೆ ಹೆಚ್ಚು ಆಸಕ್ತಿ. ಸಾಮಾನ್ಯವಾಗಿ ಇದರ ಅರ್ಥ agent infrastructure, ಮೌಲ್ಯಮಾಪನ-ಪ್ರಧಾನ ಉತ್ಪನ್ನ ಕೆಲಸ, ಆಟೊಮೇಷನ್ ವೇದಿಕೆಗಳು, ಅಥವಾ ಡೆವಲಪರ್ ಟೂಲಿಂಗ್.