mardin mardin

439
43 798

15:45

What Should Embeddings Embed Autoregressive Models Represent Latent Generating Distributions（Prince

7 часов назад

8:56

Adding Conditional Control to Text to Image Diffusion ModelsStanford 2023

9 часов назад

30:02

A Tale of Two Features Stable Diffusion Complements DINO for Zero Shot Semantic Correspondence（SJTU

9 часов назад

22:20

Mip Splatting Alias free 3D Gaussian SplattingTubingen 2024

9 часов назад

8:40

diffusion model

9 часов назад

22:19

Generative Image Dynamics（Google 2024）

14 часов назад

18:01

Rich Human Feedback for Text to Image Generation（UCSD & Google 2024）

14 часов назад

17:38

From Explicit CoT to Implicit CoT Learning to Internalize CoT Step by Step（Allen AI & UoW 2024）

14 часов назад

24:48

Towards a Robust Retrieval Based Summarization System（NCSU 2024）

16 часов назад

28:02

Hierarchical World Models as Visual Whole Body Humanoid Controllers（UCSD 2024）

16 часов назад

22:47

Medical Vision Generalist Unifying Medical Imaging Tasks in Context（JHU2024）

День назад

22:24

TUNING LAYERNORM IN ATTENTION TOWARDS EFFI CIENT MULTI MODAL LLM FINETUNINGEdinburg 2024

День назад

5:48

retrieval augmented generation2024

День назад

30:39

To Believe or Not to Believe Your LLMGoogle 2024

День назад

13:22

Scaling Rectified Flow Transformers for High Resolution Image SynthesisStability AI 2024

День назад

24:34

Position What Can Large Language Models Tell Us about Time Series AnalysisICML 2024

День назад

7:45

SIMPLE SYNTHETIC DATA REDUCES SYCOPHANCY IN LARGE LANGUAGE MODELSGoogle 2024

День назад

17:25

Groma Localized Visual Tokenization for Grounding Multimodal Large Language Models（UHK & ByteDance 2

День назад

22:41

KET QA A Dataset for Knowledge Enhanced Table Question Answering（UHK & Microsoft 2024）

День назад

15:05

Mixture of Agents Enhances Large Language Model Capabilities（Duke 2024）

День назад

14:06

Item Language Model for Conversational Recommendation（Google 2024）

День назад

33:33

SAMformer Unlocking the Potential of Transformers in Time Series Forecasting with Sharpness Aware Mi

14 дней назад

12:57

SAMformer Unlocking the Potential of Transformers in Time Series Forecasting with Sharpness Aware Mi

14 дней назад

12:57

没理解ITRANSFORMER INVERTED TRANSFORMERS ARE EFFECTIVE FOR TIME SERIES FORECASTINGTsinghua & Ant 2024

14 дней назад

29:28

DocReLM Mastering Document Retrieval with Language Model（Shanghai AI & Fudan 2024）

14 дней назад

27:32

Heterogeneity Informed Meta Parameter Learning for Spatiotemporal Time Series ForecastingSUST 2024

14 дней назад

6:12

METAGPT META PROGRAMMING FOR A MULTI AGENT COLLABORATIVE FRAMEWORKDeepWisdom 2023

14 дней назад

17:12

Mix of Granularity Optimize the Chunking Granularity for Retrieval Augmented GenerationShanghai AI 2

14 дней назад

21:25

WURSTCHEN AN EFFICIENT ARCHITECTURE FOR LARGE SCALE TEXT TO IMAGE DIFFUSION MODELS（LAION 2024）

14 дней назад

Комментарии

@jodiecomer9460 5 дней назад

在开组会吗

@kunalsingh-vi1mv 13 дней назад

Hi, I am unable to find the dataset link? Is it opensource ?

@keyin5569 13 дней назад

这个提问题的人好牛逼啊，哪位大佬？

@yangliu5075 18 дней назад

浙大的组内分享么？

@gracegoce5295 20 дней назад

good work !!

@nightknight6947 Месяц назад

ni hao world!

@anghuynhnguyen9625 Месяц назад

I wish I knew Chinese

@leyele9415 3 месяца назад

请问有代码吗

@user-xc8sl8vl5w 3 месяца назад

假如model那块使用qwen14b这样小一点的模型，也能做到吗？

@volotat 3 месяца назад

Thank you for your amazing research. It is so hard to find fast and reliable ways to get embeddings for music. Your work is a real savior.

@abc123634 3 месяца назад

These presentations you uploaded are super helpful, thank you and please keep it up!

@faizahmed8015 4 месяца назад

Hey can make video in English

@user-oj9zq2xo6g 4 месяца назад

Good summary. Thank you for posting

@astudent8885 5 месяцев назад

可能是因为刚刚开始msc 比较菜的缘故吧超级讨厌读paper，读着读着就困了（。超级高兴找到了这个channel，现在读paper 像看剧一样愉快了hhhh

@mardinmardin7108 5 месяцев назад

@astudent8885 5 месяцев назад

所以低级别到底是什么意思呢？像local edge / corner / intensity change 而不是object level 的理解吗？

@zyxwvutsrqponmlkh 6 месяцев назад

嘿，小祖宗，标题为啥非得整成洋文呢？就像中国的饺子一样，馅儿香喷喷的全是肉，却偏偏取个“法式吐司”的名儿，这不是白白让人摸不着头脑吗？看视频的人，大多数是说中文的，你说中文标题，亲切又地道，才好吸引他们点进来嘛。举个例子，你要是刷英文视频，看到一个全是英文的标题，是不是也会觉得别扭，心里嘀咕一句“这到底是哪国风味？” 再说了，用中文标题，还能顺便秀一把咱大中华的文化底蕴。来个四字成语，一两句诗词，吊足胃口，让大家伙儿都好奇得不行，非点进来一探究竟不可。听老头的，下次做视频，标题可得跟内容配一脸，用中文说中文故事，才是正经路子！

@JosephLiaw 5 месяцев назад

論文名稱 + 發表機構 + 年份資訊，清楚的讓點進這影片的人知道是在講哪一篇文章，且可以讓對這篇文章有興趣的人可以快速搜尋到我覺得沒啥毛病。

@zyxwvutsrqponmlkh 5 месяцев назад

@@JosephLiaw 是的，但你看，我只会说英语，当我搜索这篇论文时，我看到一个英文标题的视频。然后当我试图观看时，每个人都在说一些来自月球的难以理解的语言，就像是点击诱饵，或者大口喝了一大口可口可乐后发现原来是酱油一样。令人不快的惊喜是不愉快的。

@TravelAsLocal 6 месяцев назад

这跟finetune有本质区别么。文章有没有跟finetune的方法做比较？感觉包装得很晦涩

@user-io5ze8pg4g 6 месяцев назад

🥰🥰🥰🥰

@31302ttim 7 месяцев назад

GPTs 跟assistant API 一出爐真的是搞的人仰馬翻😂

@mardinmardin7108 7 месяцев назад

是……

@user-ii1th1pe7t 7 месяцев назад

讲的挺清晰的很棒

@SultanAhmed-jx9md 7 месяцев назад

Can I have the slide ?

@keeshrolling107 7 месяцев назад

谢谢大佬收获良多！！

@ruksharalam173 8 месяцев назад

It would be great if you could please make this video in English.

@cuiyaojun-ue5cr 8 месяцев назад

我觉得这里并行计算的意思，应该是o的输出是并行计算的。就是o1、o2、o3的计算是并行的(只需要根据前面的k,v就可以计算出来，k,v的计算同样是并行的)。然而rnn中的隐变量不是并行计算的，其需要计算出前一个hn-1才能计算hn，是串行的

@cuiyaojun-ue5cr 8 месяцев назад

hhh学长也说了，不好意思刚没看完就评论了

@albiboi420 8 месяцев назад

really helpful content. Thanks!

@user-ef4kw5gy7l 8 месяцев назад

你好，请教下Indicator里的Reward score是如何计算的，是使用OpenAssistant模型直接打分的吗？是用的比如 OpenAssistant/reward-model-deberta-v3-base 但是这个模型好像智能对QA场景进行打分

@jielu4321 8 месяцев назад

这是开讨论班么？小朋友被挂黑板了，哈哈哈。。。

@gtalckmin 9 месяцев назад

Would you have your presentation in an english version? Or could you enable the autotranslate option on your videos?

@fxia22 9 месяцев назад

感谢关注！

@mardinmardin7108 9 месяцев назад

大神本神！

@user-qe8fk2be7d 9 месяцев назад

你好，我也看到了这篇文章，想尝试复现他的结果。作者已经展示了他对应的代码，但是我没有找到相应的数据集。想问一下您有找到对应的数据集em，就是他跑实验用的实际的数据

@grouie6623 9 месяцев назад

实验室还招学生吗

@thomasriedel2921 9 месяцев назад

😈 'Promo sm'

@chengc03 10 месяцев назад

nit: agent读音不对

@mohammadvahidi5483 10 месяцев назад

inspiring work 👍 where can I find the code for this paper? thanks in advance

@satoshinakamoto5886 10 месяцев назад

could I get a copy of this presentation? thanks!

@xiaoguizhang1140 10 месяцев назад

应该是CIFAR

@khoaho1446 10 месяцев назад

Hello sir, I have been following you on RU-vid. I know you are a master of AI in Chinese. I have an OCR project for Chinese characters at the temple gate or main hall. I would like to contact you for some advice on datasets, models or some tips in this regard. I come from Vietnam, so my understanding of Chinese is not good. It's hard to find meaningful information on this topic.

@iworksteinsteve9687 10 месяцев назад

感谢！

@edzq9155 11 месяцев назад

感谢上传分享讨论！

@anirbanchatterjee9336 11 месяцев назад

English please, at list subtitles

@user-cw2xj5td2z 10 месяцев назад

In brief, the autoCoT method just uses a series of questions to do zero-shot CoT, and then use the output of zero-shot CoT as prompts to do few-shot learning. The questions are selected by cluster.

@yanghaoming221 11 месяцев назад

厉害啊，宝藏UP

@mardinmardin7108 11 месяцев назад

没人看a

@chuhaoliu6541 11 месяцев назад

请教一下，为什么ram可以和detection以及segmentation到方法对比呢？ram只输出标签，没有检测框和掩玛，没太理解这个评估怎么做的。

@chuhaoliu6541 11 месяцев назад

感谢分享

@xuanren5716 11 месяцев назад

不是很好理解的视频。我的理解是有个h函数，它既要拟合大语言模型的输出又要拟合supervision 函数的输出。根据原文，supervision function 是”In practice, the supervision functions can be as simple as keywords, regular expression, or knowledgebase querying. The details are discussed in Section 4.“ 在测试时，如果h输出的分低（不知道这个分怎么来的。我猜它输出的是符合supervision function的probability。h中训练时跟每个supervision function的期望输出算过loss，所以当大语言模型与某一个supervision function的输出相抵触时，probability可能会比较低），那么就开始依次检查查具体哪个supervision function输出低。将低的function对应的feedback prompt返回给大语言模型做纠正