新足迹

 找回密码
 注册

精华好帖回顾

· 三战Five Dock,终获小红P (2009-3-5) adige · 学钢琴 ---- 献给那些苦恼的家长们 (2009-9-11) 第一名
· 参加九月美食活动---甜甜的爱心:“琥珀核桃仁” (2009-9-3) 无翼而飞 · 皇家加勒比Explore of the Seas游轮体验和Isle of pines, Mystery Island 和努美阿的游玩攻略 (2015-12-24) 紫愿
Advertisement
Advertisement
楼主:jungle

[IT] 基于CHATGPT的AI应用创业——寻求建议,以及合作伙伴 [复制链接]

2021年度勋章获得者

发表于 2023-11-22 14:47 |显示全部楼层
此文章由 heroxk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 heroxk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-21 18:44
感谢感谢,果然还是要跟同行讨论,这样话题就可以聊的逐渐比较深入了。

关于用户对于TXT2SQL结果的准确 ...


楼主你想做的东西是类似Thoughtspot这种吗?基本就是问问题,直接出分析和图表,出来很多年了。

创业的话,点子并不是排第一的,更重要的是资源。大量的Engineering/人力资源、计算资源可以去烧。或者就是掌握核心技术,你有别人没有也无法复制。又或者是业界资源,开发出来的东西有企业敢用,创业公司有企业愿意投愿意收。


评分

参与人数 1积分 +1 收起 理由
jungle + 1 感谢分享

查看全部评分

Advertisement
Advertisement

发表于 2023-11-22 16:57 来自手机 |显示全部楼层
此文章由 Bessy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Bessy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
点子都不好,别人为什么给资源。给点子好的,万一实现了呢。

2008年度奖章获得者

发表于 2023-11-22 23:42 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
heroxk 发表于 2023-11-22 13:47
楼主你想做的东西是类似Thoughtspot这种吗?基本就是问问题,直接出分析和图表,出来很多年了。

创业的 ...

坦白说,在这位层主之前,我确实没有听说过Thoughtspot这个东西,上网搜了一下以后感觉非常震惊,他的广告词竟然都和我想的是一样一样的,说什么“Interact with your data using natural language"。厉害啊!我真的无法理解,怎么可能,有人能够在LLM出来之前就做出这样的东西???这实在不科学啊。

所以我就进一步研究了一下这个产品。基于他们官方的Training视频:
https://www.youtube.com/watch?v= ... O2R0tgQjYXTTDMFUHx6

看了一会以后,这个东东究竟是怎么回事,就比较清晰了。看以下截图:


这个东东究竟是什么呢,其实他就是提供了一个基于《伪代码》的开发环境。用户在他的搜索框里输入的内容虽然貌似自然语言,但并不是真正随意的自然语言,而是符合他的一些预定义语法的伪代码,其中必须包括一些固有的关键字,预定义的数据元素名称,等等。所以,这个Thoughtspot和我现在所做的,允许用户使用完全随意书写的真实自然语言,包括上下文语义关联的多轮对话进行数据分析的产品ChatWithSQL,那就完全是两码事了。

Thoughtspot虽然号称AI,但是看下来,它其实就是一个传统的BI软件,只是设计了一种较为特殊的人机交互方式而已,和真正的AI并没有什么毛关系。相比之下,有了Copilot加持的Power BI,倒是真的是有相当强的AI属性的,但是,其使用者仍然必须是经过专业培训的开发人员(Power BI的使用之繁琐,可能大家都有所体会,它并非普通Business User能轻易掌握)。

经过以上的分析,倒是也让我更加明晰了,对于ChatWithSQL这个产品真正需要强调的卖点是在于:这个产品对于Business用户是真正的零门槛,零培训。对于终端用户,我们不提供任何Training,只提供一个可以让你和数据直接对话的对话框;任何人只要懂Business,就可以马上做数据分析。

不知道我以上的文字,是否解释清楚了其中的差别?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1积分 +1 收起 理由
whitecats + 1 我很赞同

查看全部评分

2021年度勋章获得者

发表于 2023-11-23 09:40 |显示全部楼层
此文章由 heroxk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 heroxk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 heroxk 于 2023-11-23 09:41 编辑
jungle 发表于 2023-11-22 23:42
坦白说,在这位层主之前,我确实没有听说过Thoughtspot这个东西,上网搜了一下以后感觉非常震惊,他的广 ...


Thoughtspot 5年前就有了。图表都出来了,后面的数据查询、缝合、分析、挖掘都是打通的。2B有地方在用,我是说澳洲。

他们也在整合LLM,比如ThoughtSpot Sage。LLM的价值在算法。应用搭积木的话,他们内部工程师想搞定一定能搞定,因为都是集聚业界最顶尖的工程师。最多就是在他们现有的NLP上再叠上一层LLM增加语义的理解能力和容错率而已。

评分

参与人数 1积分 +1 收起 理由
jungle + 1 感谢分享

查看全部评分

2008年度奖章获得者

发表于 2023-11-23 10:42 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
heroxk 发表于 2023-11-23 08:40
Thoughtspot 5年前就有了。图表都出来了,后面的数据查询、缝合、分析、挖掘都是打通的。2B有地方在用, ...

对,这个我完全明白啊。我前面回帖的意思只是说,5年前就出来的这个Thoughtspot呢,因为当时并没有LLM这种技术,所以它并不是真正基于自然语言的数据分析。它只是一个传统的BI软件,其竞争对手是PowerBI, Tableau等等。

你后面提到的这个Thoughtspot Sage倒是对了,确实和我做的ChatWithSQL是同类的产品。也正如你所说,它就是在Thoughtspot已有的“基于伪代码的数据分析”这个技术基础上加了LLM,补上了从真正自然语言到伪代码的这一步。以下这个截图就可以看的很明显:


在我看来,这可是个好消息啊。因为任何一种新技术的发展前期,走向落地时最高的成本,其实就是Client Education的成本。既然已经有友商在做同类的东西,那就再好不过。把市场做起来了,大家可以错位竞争,拼产品拼价格拼服务,这都不是问题。这个市场足够大,完全容得下更多的友商。

具体来比较一下,我和Thoughtspot Sage的定位还是有相当大的差别:

1. 它是一整套的BI tool,如果客户要换它就得整套换,那么对于客户来说,抛开Power BI, Tableau这些巨头的产品去用它,风险还是比较大的。而我的产品定位是一套轻量化的数据分析工具,只是帮助客户快速拿到需要的数据,然后就可以直接导入Power BI,作为它的数据源来使用。Data Visualization这部分,还是交给大厂的产品比较方便,你说对吗?
2. 从实施和培训成本来说(先不说产品价格),Thoughtspot这一整套东西弄下来对于客户也很费劲,对吧?一整套新的体系,每个用户会需要一个学习过程。而我呢,主打就是一个“零培训”,开箱即用,是个人就会用,就这么简单。
3. 从数据安全性方面来说,既然大家都用到CHATGPT,那么如何保障客户数据安全?我可以对客户完全开源,Thoughtspot怕是不可能做到吧?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

2021年度勋章获得者

发表于 2023-11-23 11:12 |显示全部楼层
此文章由 heroxk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 heroxk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 10:42
对,这个我完全明白啊。我前面回帖的意思只是说,5年前就出来的这个Thoughtspot呢,因为当时并没有LLM这 ...

你查一下Snowflake Frosty,看看是不是你想弄的。这个今年上半年就看过vendor的演示了。

不差钱的企业级2B会倾向于用vendor的这些产品或内建功能,既然vendor已经进场,那用vendor的附加服务更容易通过安全架构审核。

如果比较初创的project,要想做大,持续的资金和资源支持是需要考虑。那你需要让金主认识到项目未来持续盈利的模式和竞争力,这些人不重点关注技术怎么怎么样。如果做project的初衷商业盈利不是首要考量,纯粹兴趣爱好,或者炫技,在社区发光发热,那开源让别人免费用也是可以的。

评分

参与人数 1积分 +2 收起 理由
jungle + 2 感谢分享

查看全部评分

Advertisement
Advertisement

发表于 2023-11-23 11:25 |显示全部楼层
此文章由 yzh1999 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yzh1999 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 10:42
对,这个我完全明白啊。我前面回帖的意思只是说,5年前就出来的这个Thoughtspot呢,因为当时并没有LLM这 ...

所以你这是on premise deployment?

2008年度奖章获得者

发表于 2023-11-23 11:37 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
yzh1999 发表于 2023-11-23 10:25
所以你这是on premise deployment?

完全正确。CHATWITHSQL这个产品是需要On Premise Deployment的,我并没有把它设计为一个SAAS产品。因为它是需要访问客户数据库的,一般来说,客户不会愿意把数据库接口开放到公网上吧。不知道你的经验是怎么样呢?

相比之下,MYCHATBOT是一个SAAS产品,因为这些CHATBOT需要的training资料的保密程度要求一般不是非常高的。当然,如果客户需要,我也可以做on premise deployment啊。

发表于 2023-11-23 11:53 |显示全部楼层
此文章由 anklos 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 anklos 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 11:37
完全正确。CHATWITHSQL这个产品是需要On Premise Deployment的,我并没有把它设计为一个SAAS产品。因为它 ...

喷子观点:

没有意义,不要浪费时间。

openai创始人早说了,一切openai的wrapper公司都没有前途。个人表示同意。

评分

参与人数 1积分 +1 收起 理由
jungle + 1 感谢发言

查看全部评分

发表于 2023-11-23 11:56 来自手机 |显示全部楼层
此文章由 jerryinau 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jerryinau 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果是搭建在open AI平台上的话,要在细分市场找创业机会, 通用的应用没有行业壁垒,没有技术壁垒,基本不可能成功。给你提供一个思路,在澳洲要开发专业技术人才的市场,给他们定制合适的的gpt来提高效率,他们的hourly rate很高,他们更愿意花钱买时间。你觉得有用话,我们可以深入聊一下

评分

参与人数 1积分 +1 收起 理由
jungle + 1 感谢分享

查看全部评分

发表于 2023-11-23 12:01 |显示全部楼层
此文章由 xji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-21 11:58
这位同学,我觉得你举的例子很好啊,但是示例和结论似乎有一点南辕北辙呢。

Google,OPEN AI等,他们本 ...

呵呵,我的例子只是为了说明基于别人的东西做二次开发且没有护城河走不长。并不是用来说明toC没前途。如果你能搞个有护城河的东西,或者一定想搞点啥,那我觉得toC比toB容易起步。

比如,定制化AI助手这个思路很好。比如我要是把所有我的个人文件和信息都扔到google drive,然后在部署一个私人chatgpt,把我的数据文件夹配置上去,它就可以回答我的各种问题,比如挑几张显瘦的近期个人照做工牌,挑几张好看的全家福,帮我看看我家最近24个月用电量趋势,帮我看看根据我家的过往用气情况现在市面上哪家提供商最合适我等等。但是如果你从toB入手,那你要考虑信息安全,要考虑客服售后等等。而且你是初创小公司,企业和你签了合同,明年你倒闭了怎么办?这个决策就需要有人担责任。这种决策流程很长很复杂。toC就没有太多顾虑,只要好用就行。退一万步,你真的做成了,500强开始和你签合同,openai肯定知道了,它要是和你竞争,你怎么维持你的优势?除非你的人机对话、问答质量比它高,售后客服比它完善,信息安全保护比它强,对吧?
Advertisement
Advertisement

发表于 2023-11-23 12:04 |显示全部楼层
此文章由 jodyj 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jodyj 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-20 18:07
对,Data Privacy对于企业级用户是一个非常重要的问题,尤其对于ChatWithSQL这个产品来说,因为涉及到访 ...

可以根据数据的所有权来对查询用户进行分级。 这部分操控可以数据库服务验证来完成。或者在返回时,通过AI来进行数据敏感性验证。

哥们你的2个project已经相当不错了。

我们可以加个V来探讨把。楼主要不要考虑建个群?

2008年度奖章获得者

发表于 2023-11-23 12:09 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 jungle 于 2023-11-23 12:06 编辑
anklos 发表于 2023-11-23 10:53
喷子观点:

没有意义,不要浪费时间。


感谢发言,有人喷是好事,我对此持开放态度。

不过你提到的 “openai创始人早说了,一切openai的wrapper公司都没有前途。” 请问出处在哪里,是哪位OPEN AI的创始人说的?

OPEN AI既然提供API给开发者使用,那不就是让大家来做wrapper的嘛,让开发者社区用它来做平台构建各种工具的嘛。如果他的某位创始人自己就这样说,那么岂不是和公司自身的战略背道而驰,他弄那么多API出来,还不停的在升级(比如最近,11月6号出来的ASSISTANT API),又有何意义?

我倒是认为,OPEN AI自身的定位很清楚,它就是要做平台,然后让众多的wrapper 公司百花齐放,大家一起来构建一个AI产业化的生态圈。

2008年度奖章获得者

发表于 2023-11-23 12:17 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
xji 发表于 2023-11-23 11:01
呵呵,我的例子只是为了说明基于别人的东西做二次开发且没有护城河走不长。并不是用来说明toC没前途。如 ...
退一万步,你真的做成了,500强开始和你签合同,openai肯定知道了,它要是和你竞争,你怎么维持你的优势?除非你的人机对话、问答质量比它高,售后客服比它完善,信息安全保护比它强,对吧?


哥们,你太高看我了。第一我虽然做TO B,但是还远远还达不到和500强做生意的程度,我觉得先能做一些中小型公司就很好了;第二,OPEN AI就如同现在的SAP, ORACLE这些公司,它们提供一个软件平台,然后有无数的小公司给它们做企业级实施。当然有一些超级大的客户,SAP / ORACLE 他们也有可能自己去做实施。

我还是说,AI企业级应用的这个市场足够大,容得下足够多的友商。我当然没有能力,同时也完全没有必要去和OPEN AI看上的客户竞争,对吧?

发表于 2023-11-23 12:23 |显示全部楼层
此文章由 xji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ai麻烦的地方是,很多应用都是支持,本身不是服务。换句话说,ai最大的应用就是把现有的服务变得更好。所以那些现有服务的提供商可以通过openai的加持实现这一点。而你如果本身没有现有的服务,就会变成一个ai技术提供商,凡是有前途的ai技术提供商,openai都可以拿过来自己做。

我可能自己都没说清楚。举例子吧,比如球赛实况解说,本事的产品是球赛实况,本来人工解说,低效高成本,利用ai优化现有产品。这里ai就不是产品本身,而是技术支持。

我觉得只有直接做原生产品,才可能产生直接用户需求。如果去找已有的产品,帮助它们加持ai,都是技术支持,都可以很容易被openai直接拿走。

抱歉表达不清,应该是自己都没想清楚,不过看到想做事的朋友太激动。

发表于 2023-11-23 12:29 |显示全部楼层
此文章由 anklos 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 anklos 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 12:09
感谢发言,有人喷是好事,我对此持开放态度。

不过你提到的 “openai创始人早说了,一切openai的wrapper ...

上面那哥么说的和我想法一样。

如果你的产品本身就能卖,加上ai可以提高效果。

如果你的产品本身是卖不了的,只是靠openai的api才能像个产品,就是纯粹openai wrapper。就没什么意义
Advertisement
Advertisement

2008年度奖章获得者

发表于 2023-11-23 12:36 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
heroxk 发表于 2023-11-23 10:12
你查一下Snowflake Frosty,看看是不是你想弄的。这个今年上半年就看过vendor的演示了。

不差钱的企业级 ...

感谢感谢,这个Snowflake Frosty确实很像,也是完全同类的东西。虽然它只是一套工具,还需要定制开发,但是只要说客户的数据本来就已经在Snowflake 上的话,其实vendor可以去给客户做它的实施,交付给客户的最终产品就和我做的确实几乎一模一样了。就算还有一些小的功能差别,比如固化查询,直出图表,连接POWER BI等等,那别人也是可以做出来的。

也非常同意你的观点,即 “既然vendor已经进场,那用vendor的附加服务更容易通过安全架构审核。”  Snowflake既然已经进场,必然客户已经对它的安全性评估过了一轮了,那么基于Snowflake提供的这个Frosty服务来做应用,就更容易通过客户的安全架构审核。

所以,对于那些已经把datawarehouse建在Snowflake上的公司,ChatWithSQL这个产品就没有多少优势了——我不如也加入Snowflake Partner,给他们做Snowflake Frosty的实施好了嘛,哈哈。

2008年度奖章获得者

发表于 2023-11-23 12:58 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 jungle 于 2023-11-23 12:00 编辑
xji 发表于 2023-11-23 11:23
ai麻烦的地方是,很多应用都是支持,本身不是服务。换句话说,ai最大的应用就是把现有的服务变得更好。所以 ...


不好意思,我感觉你还是没有理解AI在TO C和TO B应用中的本质差别。

你所说的 “ai最大的应用就是把现有的服务变得更好”  这是一个典型的TO C的思维,因为AI工具对于C端用户的意义就是一个各方面的ASSISTANT,让用户体验更好,做事情更方便,如此而已。但是,对于B端用户,完全不是这样的。

B端用户的需求,说白了就是4个字 “降本增效”。B端用户为什么要用AI?说到底其本质目的就是为了替代人力,干掉员工,不是为了什么把现有的服务做得更好,而是把现有的业务由人来做,改为用AI来做!我们做OPEN AI 的WRAPPER,本质意义是把AI技术落地应用到企业运营过程的各个环节上,让企业可以Redundant掉大量的员工,真正实现降本增效。这话说起来有点残忍,但恐怕这才是这一轮的AI技术企业化应用真正的本质。

OPEN AI的技术提供了这样的平台,但是要实现在运营过程中各个环节AI对人力的替代,是需要按照每个企业的实际需求,来做具体定制实施的。我还是说,AI企业化应用的市场足够大,容得下足够多的友商,OPEN AI的愿景正是要构建一个这样的生态圈,这个市场大有可为,我为何要担心OPEN AI会吃掉所有的企业客户呢?根本不存在这样的可能性嘛!

发表于 2023-11-23 13:03 |显示全部楼层
此文章由 xji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 12:58
不好意思,我感觉你还是没有理解AI在TO C和TO B应用中的本质差别。

你所说的 “ai最大的应用就是把现有 ...

好,问题在于,如果ai对企业的降本增效是显著的,那企业为什么要外包这种关键的环节?是技术太复杂吗?应该不是,因为如果本质上是openai的wrapper,那么最复杂的已经被openai解决了,而且openai一定会朝着这个方向继续前进:让应用越来越简单易行。

如果你要服务企业端,你认为哪个关键点是openai做不了,企业自身不易做,只有你第三方可以做的呢?

2008年度奖章获得者

发表于 2023-11-23 13:28 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 jungle 于 2023-11-23 12:41 编辑
xji 发表于 2023-11-23 12:03
好,问题在于,如果ai对企业的降本增效是显著的,那企业为什么要外包这种关键的环节?是技术太复杂吗?应 ...


“如果你要服务企业端,你认为哪个关键点是openai做不了,企业自身不易做,只有你第三方可以做的呢?”

这个问题很简单啊,AI模型的定制调优当然有其门槛,500强级别的大企业可以弄个团队来自己做,但是中小型企业来全部都拿来自己做的话,这个就不太现实了嘛。就好比我现在演示的CHATWITHSQL,已经基于fine-tuned GPT 3.5 实现了比如分类别汇总,按照时间段切片分析等相对复杂的数据分析功能。你如果不针对数据库结构做定制调优,问问GPT-4相同的问题看看?稍微转个弯的它都回答不了,好吧?

回到你的问题:OPEN AI当然不是不能做,而是它不可能有这个兴趣为每个企业的各种需求做模型定制。企业自身易做不易做,你不妨深入了解一些技术再判断。就还是以 SAP / ORACLE这些ERP软件在企业的实施为例,为啥企业要外包这些关键的环节给第三方公司呢?SAP / ORACLE做了这么好几十年,为什么没有把它的产品做成让企业自己就可以轻轻松松实施起来的呢?

发表于 2023-11-23 14:31 |显示全部楼层
此文章由 whitecats 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 whitecats 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 10:42
对,这个我完全明白啊。我前面回帖的意思只是说,5年前就出来的这个Thoughtspot呢,因为当时并没有LLM这 ...

保障客户数据安全,倒不是客户担心你的scaffolding的代码里面有猫腻,而是不愿意把自己的数据给上传去OpenAI做training。
不知道用MS的AzureOpenAI的enterprise不知道能不能解决这个问题和顾虑。
cal
Advertisement
Advertisement

发表于 2023-11-23 14:35 |显示全部楼层
此文章由 whitecats 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 whitecats 所有!转贴必须注明作者、出处和本声明,并保持内容完整
As of my last knowledge update in January 2022, there were several text-to-SQL (TXT2SQL) models that showed promise in converting natural language queries to SQL queries. Keep in mind that the field of natural language processing (NLP) is rapidly evolving, and newer models may have been developed since then. Here are some models that were notable at that time:

Seq2SQL:

Description: Seq2SQL is an early model that used a sequence-to-sequence architecture for generating SQL queries from natural language questions. It was trained on a large dataset of question-SQL pairs.
Paper: Seq2SQL: Generating Structured Queries from Natural Language using Reinforcement Learning
SQLNet:

Description: SQLNet is an improvement over Seq2SQL, utilizing a more sophisticated attention mechanism. It focuses on predicting the columns and conditions separately and then combining them to generate the final SQL query.
Paper: SQLNet: Generating Structured Queries From Natural Language Without Reinforcement Learning
BERT for SQL Query Generation:

Description: Some researchers have explored using pre-trained language models like BERT for SQL query generation tasks. By fine-tuning BERT on a dataset of natural language SQL queries, these models aim to capture contextual information effectively.
Paper: Investigating BERT's Knowledge of Language: Five Analysis Methods with NLP Benchmarks
Spider:

Description: Spider is a dataset and a challenge designed for evaluating the performance of text-to-SQL models. It includes a diverse set of databases and complex queries. Several models have been benchmarked on the Spider dataset.
Paper: Spider: A Large-Scale Human-Labeled Dataset for Complex and Cross-Domain Semantic Parsing and Text-to-SQL Task
TAPAS (Tabular Pre-trained Language Model):

Description: TAPAS is designed specifically for tabular data. It extends BERT to understand and generate queries for tabular data, making it suitable for tasks involving databases with tables.
Paper: TAPAS: Entity-Wide Search for Tabular Data
Keep in mind that the field of text-to-SQL and natural language processing, in general, is dynamic, and newer models may have been introduced since my last update. It's a good idea to check the latest literature and research publications for the most recent advances in TXT2SQL models.





评分

参与人数 1积分 +1 收起 理由
jungle + 1 感谢分享

查看全部评分

cal

发表于 2023-11-23 14:38 |显示全部楼层
此文章由 whitecats 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 whitecats 所有!转贴必须注明作者、出处和本声明,并保持内容完整
楼主可以看看这里的一些应用,找些灵感和防止reinvent the wheel
https://gptlibrary.com/

评分

参与人数 1积分 +1 收起 理由
jungle + 1 感谢分享

查看全部评分

2021年度勋章获得者

发表于 2023-11-23 14:43 |显示全部楼层
此文章由 heroxk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 heroxk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 12:36
感谢感谢,这个Snowflake Frosty确实很像,也是完全同类的东西。虽然它只是一套工具,还需要定制开发,但 ...

不客气,大家互相交流挺好。

我举的snowflake和thoughspot的例子就是覆盖一个数据生态的end-to-end,从数据仓库到数据工程到分析报表的通路。作为产品端,LLM基本是vendor的免费附送/非常低价格的附加功能,因为如果vendor A没有vendor B有,A在和B的竞争中就会败下阵来。厂商不是傻子,只要不是投几千万刀开发,几个工程师个把月搞定的,肯定是饿虎扑食一样冲上去。Snowflake如果我没记错的,基于LLM的功能4个月样子客户私测就出来了。能用的起SF的客户,一般才会伴随着带来资源,想做个产品挤进去,需要准备好和vendor做差异化竞争。

如果是针对小business,你让他给出几千刀,都像要他的命,部署完了不太可能拍拍屁股走人两不相欠,后续一堆要求support,一会儿这不灵,一会那不对的,忙前忙后到头来都是辛苦钱。

Consulting的话,确实是比拼对技术的理解、定制化能力和系统整合能力。能给优质客户提供这样的服务,壁垒是客户关系和sales。

评分

参与人数 1积分 +2 收起 理由
jungle + 2 我很赞同

查看全部评分

2008年度奖章获得者

发表于 2023-11-23 15:08 |显示全部楼层
此文章由 jungle 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jungle 所有!转贴必须注明作者、出处和本声明,并保持内容完整
whitecats 发表于 2023-11-23 13:31
保障客户数据安全,倒不是客户担心你的scaffolding的代码里面有猫腻,而是不愿意把自己的数据给上传去Ope ...

我前面回帖已经提到了嘛,我的ChatWithSQL这个产品根本不会上传客户的任何real data去给OPEN AI,我提交的只有数据库结构和相关调优的一些文档而已。所以客户不愿意把自己的数据上传给OPEN AI,那很好啊。

我之所以愿意对客户开放源码,是因为想要把这个过程对客户完全透明化,让他知道我确确实实没有传数据给OPEN AI,不然空口无凭嘛。只是这个意思而已。

发表于 2023-11-23 17:24 |显示全部楼层
此文章由 whitecats 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 whitecats 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 15:08
我前面回帖已经提到了嘛,我的ChatWithSQL这个产品根本不会上传客户的任何real data去给OPEN AI,我提交 ...

如果不传用户数据的话,这个chat如何实现说的话有客户的domain knowledge和accent呢?
cal
Advertisement
Advertisement

发表于 2023-11-23 17:49 |显示全部楼层
此文章由 mzbac 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 mzbac 所有!转贴必须注明作者、出处和本声明,并保持内容完整
在自己不熟悉的领域创业的人才,楼主赶紧all in...机会大大的现在卖房都有点晚了。

评分

参与人数 1积分 +1 收起 理由
jungle + 1 坚持不懈的喷,给你点赞

查看全部评分

发表于 2023-11-23 17:49 |显示全部楼层
此文章由 anklos 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 anklos 所有!转贴必须注明作者、出处和本声明,并保持内容完整
jungle 发表于 2023-11-23 15:08
我前面回帖已经提到了嘛,我的ChatWithSQL这个产品根本不会上传客户的任何real data去给OPEN AI,我提交 ...

公司直接可以和openai签署协议的,数据不会被openai作为训练。

公司可以直接调用azure部署的openai而不需要担心数据安全问题。当然公司信不过是另外一回事,但我知道很多大公司都是直接用。

我可能对市场不太了解,现在还有公司买软件自己部署吗?就算你把源代码给公司,出了bug他们自己修吗?小公司没能力大公司不需要。

评分

参与人数 1积分 +1 收起 理由
jungle + 1 感谢分享

查看全部评分

2021年度勋章获得者

发表于 2023-11-23 18:11 |显示全部楼层
此文章由 heroxk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 heroxk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
anklos 发表于 2023-11-23 17:49
公司直接可以和openai签署协议的,数据不会被openai作为训练。

公司可以直接调用azure部署的openai而不 ...

粗俗的讲一下,弄个server,下个open-source llm模型比如llama,装个vector db,商业背景信息embed一下。然后弄个rest api接Q&A LLM去接受和回复用户的问题。后面其实就是查询和预测问题了。

免费的模型自己部署模型比较简单准确度不如openai,如果提高的话增加参数和层数又需要有很强的计算能力($$)。企业级不是不可以考虑open-ai,怎么抹除和还原敏感信息感觉是个领域。

评分

参与人数 1积分 +1 收起 理由
whitecats + 1 我很赞同

查看全部评分

发表于 2023-11-23 18:19 |显示全部楼层
此文章由 vivic2333 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 vivic2333 所有!转贴必须注明作者、出处和本声明,并保持内容完整
heroxk 发表于 2023-11-23 15:11
粗俗的讲一下,弄个server,下个open-source llm模型比如llama,装个vector db,商业背景信息embed一下。 ...

我也想过这个,github上有个案例:https://github.com/DLLXW/baby-llama2-chinese

我想的是就用这个模型训练,针对特定领域,医学、天文、工程、矿业等,客户就是这些特定领域的公司、咨询,应该挺有意思。

评分

参与人数 2积分 +2 收起 理由
whitecats + 1 感谢分享
jungle + 1 感谢分享

查看全部评分

这个人还行

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部