Mohab Ayman,开罗开发商,开罗省,埃及
Mohab is available for hire
Hire Mohab

Mohab Ayman

Verified Expert  in Engineering

数据科学家和人工智能开发者

Location
开罗,埃及开罗省
Toptal Member Since
December 4, 2020

Mohab是一位数据科学家和机器学习开发人员, 专攻自然语言处理(NLP)和计算机视觉. 他有五年的工作经验, 最近的项目集中在自然语言理解(NLU)领域的机器学习上,, cheminformatics, and self-driving cars. Mohab紧跟深度学习的前沿.

Portfolio

量子创新风险投资有限公司
人工智能(AI), GPT,后端,api, Django, Azure, LangChain...
Octimine
Web开发,数据建模,JavaScript, Docker Hub, NumPy, Matplotlib...
Microsoft
Web开发,Matplotlib, NumPy, .. NET, Visual Studio Code (VS Code)...

Experience

Availability

Part-time

Preferred Environment

Anaconda, PyTorch, Linux, Python

The most amazing...

...我开发的项目是一个深度学习系统,用于配对工作伙伴,根据他们的个人资料的语义相似性为他们的相似目标进行合作.

Work Experience

AI Developer

2023 - 2024
量子创新风险投资有限公司
  • 开发了一个llm驱动的应用程序,使投资备忘录创建过程自动化.
  • 使用Langchain创建LLM的体系结构.
  • 将LLM应用程序封装在Django应用程序中,并将其部署到Azure Cloud.
Technologies: 人工智能(AI), GPT,后端,api, Django, Azure, LangChain, FAISS, OpenAI, OpenAI GPT-3 API, OpenAI GPT-4 API, 大型语言模型(llm), Prompt Engineering

Data Scientist

2019 - 2021
Octimine
  • 进行生物医学命名实体识别(NER)的研究,用Python开发了一个系统,从法律文本中提取和规范化学实体和疾病.
  • 在Node中创建了一个监控系统.Js从登台服务器和生产服务器收集信息. 使用Grafana可视化结果并制作监控仪表板.
  • 使用Docker对各种系统组件的外部依赖和运行时进行容器化,以减轻依赖开销并创建更快的开发管道.
Technologies: Web开发,数据建模,JavaScript, Docker Hub, NumPy, Matplotlib, Machine Learning, Visual Studio Code (VS Code), GitLab, Git, Jupyter Notebook, 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), Word2Vec, Linux, Java, Python, Data Science, Software Engineering, Neural Networks, Deep Neural Networks, 自然语言工具包(NLTK), Node.js, Docker, Grafana, Pandas, Cheminformatics, 命名实体识别(NER), Data Visualization, Deep Learning, Transformers, HDF5, Scikit-learn, Seaborn, PyTorch, Elasticsearch, Kibana, Data Engineering, Big Data, XPath, XQuery, Scraping, Data Scraping, Text Classification, Regex, Categorization, Data Pipelines, Data Analytics, Data Analysis, Analysis, Analytics, Scientific Data Analysis, JSON, Redis, Data Mining, Pytest, Text Mining, Language Models, BERT, 人工智能(AI), Text Recognition, Data Processing, Data Transformation, Word Embedding, Back-end, Jupyter, Dashboards, Software Architecture

研究软件开发工程师

2018 - 2019
Microsoft
  • 基于各种NLU评估指标,在Python中开发了一个自动基准测试管道. 管道以自动化的方式定期运行,并产生最新的系统评估指标,并与竞争对手的系统进行比较.
  • 用c#和 .NET framework. 创建新的API端点并优化现有的API端点, 从而显著降低响应延迟.
  • 将带有遗留代码的大型系统组件重构为遵循最佳实践设计模式的可扩展设计, 因此,在保持向后兼容性的同时,允许更容易的未来可扩展性.
技术:Web开发,Matplotlib, NumPy, .. NET, Visual Studio Code (VS Code), Visual Studio, Git, 自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Word2Vec, Anaconda, 敏捷软件开发, Software Engineering, Data Science, Seaborn, Scikit-learn, 自然语言工具包(NLTK), Pandas, 自然语言理解(NLU), 命名实体识别(NER), Data Visualization, ASP.NET, C#, Python, Regex, Text Classification, Classification, Text Categorization, SQL, Data Analysis, Data Analytics, Data Pipelines, Analysis, Analytics, Scientific Data Analysis, Pytest, ETL, ETL Tools, ETL Testing, JavaScript, Text Mining, JSON, Code Review, Technical Hiring, Interviewing, 人工智能(AI), Data Processing, CSV, Data Transformation, Back-end, Software Architecture, Azure

Data Scientist

2016 - 2016
Self-employed
  • 与化学专家合作完成化学数据分析任务, 侧重于发现与特定疾病相关的药物中化合物结构及其用途之间的模式和关系.
  • 在自然语言理解方面进行实验,并创建了一个执行意图分类和命名实体识别的管道,以自动处理客户收据.
  • 采用图像识别和计算机视觉算法,增强了非标车牌识别系统的识别能力, hand-written, 以及多语言角色.
Technologies: C++, Visual Studio Code (VS Code), GitLab, GitHub, Git, Jupyter Notebook, R, 生成预训练变压器(GPT), 自然语言处理(NLP), GPT, Word2Vec, Anaconda, Data Science, Software Engineering, Data Visualization, 自然语言工具包(NLTK), Computer Vision, OpenCV, 命名实体识别(NER), 自然语言理解(NLU), Cheminformatics, NumPy, Matplotlib, Seaborn, Scikit-learn, Pandas, Python, 探索性数据分析, Text Categorization, Data Analysis, Data Analytics, Analysis, Analytics, Scientific Data Analysis, Data Mining, JavaScript, JSON, 人工智能(AI), OCR, Text Recognition, Jupyter

Research Intern

2015 - 2015
Ulm University
  • 进行神经信息学方面的研究, 专注于分析患者的生物医学数据,并识别反映患者在医疗手术期间所经历的疼痛程度的模式.
  • 创建机器学习模型,根据面部表情的视觉数据和神经系统传感器记录信号的生物电位数据,预测特定患者的疼痛强度.
  • 用R语言开发了一个神经网络包,实现了参数化, 采用弹性和经典反向传播算法优化多层感知.
Technologies: Ggplot2, C#, Data Science, Data Visualization, Deep Learning, Neuroinformatics, Neural Networks, Machine Learning, Python, R, Data Analysis, Data Analytics, Analysis, Analytics, Scientific Data Analysis, Clustering, RStudio, RStudio Shiny, Dplyr, Tidyverse, 人工智能(AI)

投资备忘录创建AI助手

我为风险投资公司开发的人工智能助手. 该助手将创建投资备忘录的过程自动化. 该模型使用多个数据源作为输入:web搜索、web爬虫和自定义上传的文档. 该模型将创建投资备忘录的时间从几周缩短到几天.

律师人工智能助理

协助律师阅读和书写合同的制度, 在哪里建立了一个推荐系统,根据律师写的句子的相似句子提供建议. 根据收集到的数据, 开发了一个大型语言模型(LLM),以协助律师生成法律术语和法律合同章节的定义. 该项目包括创建一个数据管道来抓取和解析HTML中的法律合同.

用于自动客户服务聊天评估的AI法官

An automatic AI Judge, built using GPT4, 用于自动评估电子商务网站客户服务机器人与客户之间的聊天对话过程. 人工智能法官评估客服机器人的回答是否真实, appropriate, and of good quality. To achieve this, 人工智能法官可以访问它可以查询的数据源,以验证客户服务机器人的正确性.

使用Web爬行和GPT生成知情的站点地图

一个基于python的管道,旨在通过相关网站的网络爬行来创建全面的站点地图, 利用GPT分析多个抓取的站点地图, 并生成一个统一和更完整的网站结构概述.

工作同事匹配的词嵌入

一种将具有相似目标和技能的同事匹配起来以促进合作的系统. 我建立了一个推荐系统,它使用词嵌入算法根据员工的个人资料找到语义相似度. Additionally, 员工可以很容易地使用该系统来获得有关同事的建议,这些同事将帮助他们完成任务.

用于标注语义分割像素的深度学习助手

一个帮助人类注释者标记图像像素以进行语义分割的系统. 该系统使用主动学习来建议要标记的像素子集, 但却达到了相当的准确度. 我使用PyTorch和其他辅助库构建并实现了该系统. 它大大减少了人类注释者标记图像所需的工作量.

自动化数据处理和可视化管道

An automated pipeline, 用Python和倭黑猩猩创建的, 运行具有多个参数的链式数据处理操作,并使用Seaborn自动生成分析图. 管道的目标是逆向工程为客户复制一些结果所需的参数.

提高图像质量的生成对抗网络

一个使用生成对抗网络从客户端使用的低分辨率图像和语义标签中恢复高分辨率图像的系统. 该系统在PyTorch中实现,并使用超分辨率GAN架构的预训练模型.

基于图cnn和gan的交通场景生成

用于生成用于训练自动驾驶汽车的交通场景图像的深度学习管道. 该管道使用图形卷积神经网络和生成对抗网络的最新进展来控制交通场景中物体的数量和类型,以及生成的图像的白天和天气条件.

Languages

Python, SQL, C#, R, Java, C++, JavaScript, SPARQL, RDF, XPath, XQuery, Regex, Google Apps Script, TypeScript

Libraries/APIs

Pandas, Scikit-learn, NumPy, SciPy, PyTorch,自然语言工具包(NLTK), HDF5, TensorFlow, Node.js, Matplotlib, OpenCV, Ggplot2, Spark ML, SQLAlchemy, NetworkX, Tidyverse, Google Sheets API, Google Speech API, 谷歌语音转文本API, React, Office API, LINQ, D3.js

Paradigms

数据科学,敏捷软件开发,MapReduce, ETL,搜索引擎优化(SEO)

Platforms

Jupyter Notebook, Visual Studio Code (VS Code), 亚马逊网络服务(AWS), Linux, Anaconda, Docker, RStudio, 谷歌云平台(GCP), Azure

Storage

PostgreSQL, Cassandra, Elasticsearch, MySQL, Data Pipelines, JSON, Redis, Redshift

Other

Neural Networks, Data Visualization, 自然语言处理(NLP), Machine Learning, 人工智能(AI), Data Analysis, Data Scraping, Data Analytics, Analysis, Analytics, ChatGPT, 大型语言模型(llm), GPT, OpenAI GPT-4 API, LangChain, OpenAI GPT-3 API, OpenAI, Prompt Engineering, Transformers, Computer Vision, Active Learning, Deep Learning, Data Engineering, BERT, A/B Testing, Cohort Analysis, Metabase, Language Models, 自然语言理解(NLU), Semantic Segmentation, Software Engineering, Cheminformatics, Word2Vec, GloVe, 卷积神经网络(CNN), 递归神经网络(rnn), Neuroinformatics, Deep Neural Networks, Data Modeling, Web Development, Linear Regression, Linear Algebra, Time Series, Time Series Analysis, Social Network Analysis, Network Analysis, Mathematics, Statistics, Data Processing, Bonobo, Reverse Engineering, Big Data, Scraping, Text Classification, Classification, 探索性数据分析, Text Categorization, Categorization, Scientific Data Analysis, Clustering, FAISS, Social Network Analytics, Image Processing, Data Build Tool (dbt), Funnel Analysis, Hypothesis Testing, 生成对抗网络(GANs), Image Analysis, Shell Scripting, Web Scraping, 统计数据分析, Hugging Face, 机器学习操作(MLOps), Google Cloud Functions, Predictive Analytics, Data Mining, ETL Tools, ETL Testing, Text Mining, Self-driving Cars, Code Review, Technical Hiring, Interviewing, Recommendation Systems, Excel 365, Experimental Design, OfficeJS, Office Add-ins, Database Analytics, 人工神经网络(ANN), Search, 生成预训练变压器(GPT), GPT-Neo, HTML Parsing, Text Generation, OCR, Text Recognition, CSV, Data Transformation, Word Embedding, Back-end, Dashboards, Gunicorn, Chatbots, Full-stack, Software Architecture, APIs, Cloud, Text to Task, Data Synthesis

Tools

Celery, 命名实体识别(NER), Seaborn, Git, Visual Studio, Grafana, GitLab, Docker Hub, GitHub, Spark SQL, Kibana, Apache Airflow, Amazon SageMaker, Elastic, Dplyr, Google Sheets, Pytest, Babel, Yeoman, Doc2Vec, Jupyter

Frameworks

ASP.NET, Flask, .. NET, Spark, Apache Spark, RStudio Shiny, Django, Jinja, Streamlit

2019 - 2022

数据科学硕士学位

慕尼黑工业大学(TUM) -德国

2011 - 2016

计算机科学(荣誉)学士学位

开罗的德国大学——埃及新开罗

OCTOBER 2022 - PRESENT

C#: Advanced Practice

LinkedIn

OCTOBER 2022 - PRESENT

React.js:构建一个接口

LinkedIn

OCTOBER 2022 - PRESENT

亚马逊红移必需品

LinkedIn

OCTOBER 2022 - PRESENT

Microsoft Office开发人员插件

LinkedIn

OCTOBER 2022 - PRESENT

React.js Essential Training

LinkedIn

OCTOBER 2022 - PRESENT

React:创建和托管一个全栈站点(2019)

LinkedIn

OCTOBER 2022 - PRESENT

实验设计的数据科学

LinkedIn

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring