You are viewing a single comment's thread from:

RE: Team Europe’s Deep Dive (Report #3)

in Steem POD Team2 days ago

I started Thoth with the free models from ArliAI, but somewhere along the way I learned that Gemini has a free tier, too. I never got around to updating the variable naming, but right now, Thoth works with both sets of models. Eventually, I might add Hugging Face API, too, if I can find time and figure out how. I've seen claims that they have a free tier, but I haven't been able to confirm that so far.

The free tier from ArliAI currently offers the Qwen3-14B family, but those results are currently unimpressive. The gemini family which is available for free from Google produces far superior results right now (You can see those results at the @thoth.test account, and you can see a Qwen3-14B run here.).

The main point of Thoth isn't the AI analysis - that's just an enabler. The main point is to provide an alternative to the spammy delegation bots that are currently flooding the social ecosystem here with pollution.


From the original post, I agree with @moecki that there's probably not a free way to do the AI detection at the scale needed to evaluate every post. Eventually I hope to plug both plagiarism detection and AI detection into Thoth, but I'm thinking that both will probably require paid services. The only reason Thoth operates for free is that I do a lot of screening using traditional filtering techniques before the LLM ever sees anything.

Thoth's prompt does direct it to filter out AI and plagiarized content, but I doubt very much if the LLM really has the capability to do that.

As you note, we could roll our own AI detection, but I think that would require more compute & storage resources than I have available to me, and I think it would probably just be cheaper to get a paid subscription to an API from a service that already does it.

Sort:  

El proyecto en si me parece una gran iniciativa, además de la importancia que tiene encontrar personas en busca de soluciones, actualmente hay muchas cosas rodando por ahí que pueden ser de utilidad y sé que a medida que se adentra en el desarrollo del proyecto podrá encontrar cosas de mayor utilidad y desechar las de menor utilidad, ha tocado un punto importante y es saber que hay disponible antes de invertir tiempo y recursos intentando inventar "la rueda", si ya existe y es más económico usarlo entonces es la opción más factible.

Cuando entiendo que tenemos limitaciones a funciones porque algo avanzado requiere un pago y miro que STEEM a diario genera una piscina de dinero para repartir no le encuentro lógica al asunto, ¿cómo no distribuir parte de esa piscina al desarrollo de la cadena de bloques al desarrollo del ecosistema?, si STEEM es una blockchain que produce recursos cada día seguro habrá alguna manera de atraer esos recursos al desarrollo de proyectos que permitan mejorar el ecosistema, como lo es su caso, así ya no habrían esas limitaciones sobre buscar cosas gratuitas y limitarse cuando se requiera versión de pago, encontrar la forma de hacerlo de manera transparente tal vez sea un reto pero es algo que está ahí y no se aprovecha.

De verdad parece un gran proyecto, estoy seguro de que podrá marcar un antes y un después cuando esté completamente desarrollado.