摘要:本研究探讨了由GPT-3.5和GPT-4提供支持的流行OpenAI模型Chatgpt的有效性和效率,以了解其对编程和潜在软件开发的影响。为了衡量这些模型的性能,使用主要基本的Python问题(MBPP)数据集采用了定量方法。除了对GPT-3.5和GPT-4的直接评估外,还进行了涉及AI景观中其他流行大语模型的比较分析,尤其是Google的Bard和Anthropic的Claude,还进行了衡量和比较他们在同一任务中的熟练程度。结果突出了ChatGPT模型在编程任务中的优势,为AI社区(特别是针对开发人员和研究人员)提供了宝贵的见解。随着人工智能的普及,这项研究是对AI辅助编程领域的早期研究。