Vivek Ramaswamy
验证专家 in Engineering
SQL Developer
Vivek是一位拥有15年设计和构建系统经验的IT专业人士, 过去五年在大数据系统中. 他擅长多种工具、技术和编程语言,包括SQL、 .. NET、Java、Scala和JavaScript. Vivek处理过Excel、VBA、Access、RDBMS和分布式系统中的数据.
Portfolio
Experience
Availability
首选的环境
Apache Kafka, Apache Hive, Spark, SQL, Excel VBA, Apache Impala, Cloudera, Scala, Java 8, Python
最神奇的...
...我所做的是提高数据加载器的效率,同时为过程带来更多的可见性.
Work Experience
Data Engineer
Pogo科技有限公司.
- 收集需求以了解不同的数据源及其数据导出模式. 执行概念的快速验证,以确定用于构建数据管道的适当工具.
- 在Dagster中构建标准化的数据管道,从多个数据源获取数据,并以预定的方式在Snowflake中放置数据. 将运行通知路由到空闲通道,以便于监控和监督.
- 重新利用并启用了一个实时阶段区域,以便为湿运行和验证提供类似于测试的环境.
软件工程师
领先的外汇交易平台
- 在谷歌云数据流中设置流媒体管道,从内部部署中获取数据, 无模式Kafka主题到BigQuery. 捕获和存储模式漂移,以确保平稳运行.
- 评估了不同的tick数据库供应商来存储tick数据. 运行poc,并通过设置绿地环境和运行常见用例模拟来比较不同产品的基准性能.
- 使用MuleSoft数据流代替Informatica作业.
- 在Google IAP上构建了一个基于Java Spring框架的包装器服务,用于查询Domo并以CSV格式向经销商发送数据. 根据已有的仪表板重建Domo仪表板.
大数据工程师|副总监
领先保险经纪公司
- 使用StreamSets Data Collector构建ETL管道,将来自不同来源的数据投放到基于S3的云数据平台中,并由Impala支持.
- 评估使用StreamSets Transformer作为批处理的补充ETL工具.
- 评估Apache Airflow在编排方面的使用,并决定它是否适合多租户环境.
高级大数据工程师
领先的法国投资银行
- 重新设计了流应用程序,使其更具上下文性,更符合数据的本质.
- 将登录功能整合到ELK中,以获得更多的实时度量和分析.
- 改进了部署过程,使用Unix帮助程序使其更加高效和独立.
高级副
私人和投资银行领域的全球银行领导者
- 通过识别瓶颈并应用技术和功能修复改进了Dynamics CRM应用程序的性能和加载时间. 通过利用来扩展数据加载器 .. NET多线程和Dynamics CRM的批量处理能力.
- 通过使用Hive和Spark SQL表的缓存功能,加快了Spark作业的计时速度.
- 使用Akka Streams来改善边缘节点上的大量文件加载过程.使用最少的资源来规避吞吐量和内存争用问题.
IT Analyst
领先的咨询公司
- 确定瓶颈并改进SQL查询的性能.
- 从Dynamics CRM 4迁移应用程序.0到Dynamics CRM 2011. 修改了应用程序以使用新的, 同时还结合了Silverlight来显示一个新的自定义UI.
- 将IBM MQ与VB 6集成以取代屏幕清除过程.
- 构建一个基于Excel的工具,使用宏从多个Excel文件中捕获数据用于报告.
研究工程师
VoIP服务提供商
- 支持Linux后端系统与基于windows的前端系统之间的系统集成.
- 建立了一个基于flash的SIP软电话,集成在浏览器中,用于基于windows的MIS系统,方便显示座席可用性和直接进行内部SIP呼叫.
- 通过将内部系统从vb5迁移到vb6,确定并优化了内部系统.
- 使用VBA/Macros创建了一个基于excel的对账工具,以突出显示和报告计费错误.
Experience
批量数据仓库向实时数据湖的迁移
我们使用CDC工具将数据库提要更新移动到Kafka,并编写Spark流应用程序在HBase中处理和存储数据. 数据湖之外还有一个缓存系统,以便更快地访问数据.
OUTCOME
由于这种迁移,关键的下游应用程序可以实时访问数据. 他们不再需要等待T+1天来获得feed,或者在批处理失败的情况下处理陈旧的数据. 由于接近实时的数据馈送, 它还创造了新的机会来识别误用和潜在的交叉销售产品.
资本市场数据的本地数据湖
OUTCOME
该项目对整个组织的贸易数据进行了整理,并为科学家提供了一个环境, actuaries, 还有风险建模者来分析, test, 调整他们现有的和新的模式.
蜱虫数据库评估
Skills
Languages
Orc, SQL, Excel VBA, Java 8, Scala, C++, Python, Power Query M, Visual Basic 6 (VB6), Flash ActionScript, ActionScript 3, Java, Snowflake, Python 3, Visual Basic, Visual Basic for Applications (VBA)
Paradigms
ETL,并行计算
Platforms
Apache Kafka, Hortonworks数据平台(HDP), MuleSoft, Slackware, 谷歌云平台(GCP), 亚马逊网络服务(AWS)
Storage
HDFS, Apache Hive, 数据库管理系统(DBMS), RDBMS, HBase, Microsoft SQL Server, Kdb+, ExtremeDB, Amazon S3 (AWS S3), PostgreSQL, Greenplum, SQL Server 2008 R2, Neo4j
Other
StreamSets, 工程数据, Google BigQuery, 分布式系统, ELT, Big Data, APIs, OneTick, Dynamics CRM 2011, Dynamics CRM 2013, Parquet, Informatica, 会话发起协议(SIP), Dynamics CRM插件, Dagster, ETL Tools, GraphDB
Frameworks
Spark, .. NET, Apache Spark, Spring Boot, Hadoop
Libraries/APIs
火花流,Protobuf
Tools
Spark SQL, ELK(弹性堆叠), Cloudera, Impala, Apache Airflow, IntelliJ IDEA, Apache Impala, BigQuery, Apache Maven, Cloud Dataflow, Asterisk, Microsoft Dynamics CRM, MS Silverlight, IBM MQ, Jenkins, Stash, Git, Control-M, Slack, Tableau, Domo, Apache Beam, Microsoft Excel, Microsoft Power BI
Education
信息技术硕士学位
孟买大学-孟买,印度
信息技术学士学位
孟买大学-孟买,印度
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
分享你的需求
选择你的才能
开始你的无风险人才试验
对顶尖人才的需求很大.
Start hiring